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PRODUITS D'EXPRESSION DE GENES IMPLIQUES DANS DES AFFECTIONS 
DU METABOLISME DU CHOLESTEROL 



La presente invention concerne des acides nucleiques exprimes a 
5 partir de genes localises dans le genome humain dans la region 9q31- 
34 du chromosome 9, susceptibles d'etre impliques dans des maladies 
genetiquement liees a ce locus chromosomique, notamment les 
affections du metabolisme des lipoproteines plasmatiques, plus 
particulierement le transport inverse du cholesterol. 

10 L'invention concerne egalement des polypeptides codes par 

certains de ces acides nucleiques ainsi que des anticorps diriges 
specifiquement cbntre de tels polypeptides, utiles comme reactifs de 
diagnostic. 

L'invention est enfin relative a des vecteurs et des cellules hdtes 
is recombinantes comprenant ces acides nucleiques ou des fragments de 
ceux-ci. 

Les lipoproteines, complexes proteiques incorporant des lipides 
permettant le transport de ces derniers dans la circulation sanguine, 
normalement presentes dans le plasma sanguin varient en taille et en 

20 composition mais apparaissent toutes sous forme de microemulsion. 

Les particules des lipoproteines sont spheriques et contiennent un 
noyau central de lipides non polaires (en majorite des triglycerides et des 
esters de cholesterol) et une monocouche de surface de lipides polaires 
(du cholesterol et majoritairement des phospholipides) et des proteines 

25 denommees apolipoproteines (apo). 

La plupart des composants proteiques $e la monocouche de 
surface, tous comme les phospholipides, ont des proprietes 
amphipathiques. L'association des lipides polaires et des proteines avec 
les lipoproteines est ainsi realis6e via des forces hydrophobes grace 

30 auxquelles les chaines decides gras et les chaTnes laterales 
d'aminoacides non polaires sont exclues de Tenvironnement aqueux. 
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La plupart des apolipoproteines possedent des regions 
amphipatiques en helice (apolipoproteine A-l, A-ll, A-IV, C-l. C-ll. 0-111 et 

La densite des particules de lipoproteine est mversement 
5 proportionnelle a leur taille, leur densite refletant les quantites relatives 
de lipides non polaires de faible densite contenues dans le noyau et de 
proteines de surface de haute densite presentes. 

Parmi les lipoproteines de grande taille on connatt les 
chylomicrons, secretes par les enterocytes, dans lesquels I'apo B-48 est 
io majoritaire. et les VLDL, secretees par les hepatocytes, qui contiennent 

la proteine apo B-100. 

Les classes de lipoproteines les plus petites, LDL et HDL, 
contiennent majoritairement des esters de cholesterol dans leur noyau. 
Les formes matures de ces particules ne sont pas secretees directement 
15 a partir des cellules mais sont plus particulierement produites par des 
voies metaboliques au sein du plasma sanguin. 

Les particules LDL represented les produits finaux du 
metabolisme des particules VLDL. 

Certains composants des particules HDL sont derives a partir des 

20 chylomicrons. 

Ainsi, les lipoproteines de haute densite (HDL) sont Tune des 
quatre classes majeures de lipoproteines qui circulent dans le plasma 
sanguin . 

Ces lipoproteines sont impliquees dans differentes voies 
25 metaboliques telles que le transport lipidique, la formation des acides 
biliaires. la sterofdogenese, la proliferation cellulaire et en outre 
interferent avec les systemes de proteinase plasmatique. 

Les HDL sont de parfaits accepteurs de cholesterol libre et, en 
combinaison avec les proteines de transfert d'ester de cholesterol 
30 (CETP), la lipoproteine lipase (LPL), la lipase hepatique (HL) et la 
lecithine : cholesterol acyltransferase (LCAT), jouent un rdle majeur dans 
le transport inverse du cholesterol, c'est-a dire le transport du cholesterol 
en exces dans les cellules peripheriques vers le foie pour son elimination 
de I'organisme sous forme d'acide biliaire. 
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Les HDL ne transporter^ pas seulement le cholesterol des cellules 
peripheriques vers le foie mais le distribuent egalement aux cellules 
productrices de steroTdes ou aux cellules peripheriques appauvries en 
cholesterol. 

5 " Les precurseurs des HDL sont secretes sous forme discoidale d 

partir de I'intestin et du foie, a partir desquels les particules spheriques 
sont formees grace a la formation d'esters de cholesterol qui migrent au 
coeur de la particule lipoproteique. 

Les particules naissantes de HDL contiennent des apo A-l et apo 
10 A-IV, alors que les particules de HDL h£patiques naissantes sont riches 
en apo A-l, apo E et apo A-l I. 

La partie lipidique de ces particules consiste en des 
phospholipides et de petites quantites de cholesterol libre et de 
triglyceride. 

i 5 || a 6te demontre que les HDL jouent un role central dans le 

transport du cholesterol des tissus peripheriques vers le foie. 

L'exces de cholesterol non esterifie des cellules peripheriques 
riches en cholesterol est capte par les HDL et subit une esterification par 
Taction de la LCAT. Ces HDL enrichies en esters de cholesterol sont 

20 captees par des proteines de liaison ou r£cepteurs des HDL a la surface 
des h6patocytes et y delivrent leurs esters de cholesterol. 

Le role protecteur des HDL dans le transport inverse du 
cholesterol est confirmee par les etudes epidemiologiques demontrant 
une relation inverse entre les concentrations de cholesterol dans ces 

25 HDL et le risque d'apparition de maladies coronariennes, ou encore par 
des observations selon lesquelles les HDL acceptent efficacement les 
exces de cholesterol intracellular a partir de types cellulaires varies. 

Les lipoproteines atherogenes sont ingerees par les macrophages 
ou cellules p£riph6riques et degradees dans les lysosomes. Le 

30 cholesterol est relargue des lysosomes et. est re-esterifie dans le 
compartiment cytoplasmique. 

II a ete en particulier montre que les HDL riches en apo A-l 
stimulent les flux de cholesterol a partir des macrophages ou des 
cellules peripheriques vers le compartiment extracellulaire, suite a une 
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interaction avec des proteines de liaison des HDL presentes a la surface 
de ces cellules. 

Diverses maladies liees a une deficience en HDL ont ete decrites, 
5 comprenant la maladie de Tangier, la deficience en HDL et la deficience 
en LCAT. 

La deficience impliquee dans la maladie de Tangier est reliee a un 
deficit cellulaire dans la translocation du cholesterol cellulaire dans 
lequel les precurseurs de HDL sont degrades dans les lysosomes. 

10 Neanmoins. pour la maladie de Tangier, la nature exacte du deficit n'a 
pas encore ete precisement definie. 

Dans la maladie de Tangier, ce deficit cellulaire conduit a une 
perturbation du metabolisme lipoproteique. Les HDL n'incorporant pas 
de cholesterol a partir des cellules peripheriques et ne pouvant pas etre 

15 metabolisee correctement. sont eliminee rapidement de I'organisme. La 
concentration plasmatique en HDL de ces patients est done 
extremement reduite et les HDL n'assurent plus le retour du cholesterol 
vers le foie. Ce cholesterol s'accumule dans ces cellules peripheriques 
et provoquent des manifestations cliniques caracteristiques telles que la 

20 formation d'amygdales orangees. De plus, d'autres perturbations 
lipoproteiques comme une surproduction de triglycerides ainsi qu'une 
synthese et un catabolisme intracellular accrus des phospholipides 
sont observees. 

La maladie de Tangier, dont les symptomes ont ete decrits ci- 
25 dessus. est classee parmi les affections famitiales liees au metabolisme 
des HDL qui sont les plus couramment detectees chez les patients 
affectes de maladies coronariennes. 

De nombreuses etudes ont montre qu'un niveau reduit de 
cholesterol HDL est un excellent facteur de risque permettant de depister 
30 une affection coronarienne. 

Dans ce contexte. des syndromes lies aux deficiences en HDL ont 
presente un interet accru durant la decennie passee du fait qu'elles 
permettent d'accrottre la comprehension du r6le des HDL dans 
I'atherogenese. 
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Plusieurs mutations dans le gene apo A-l ont ete caracteris6es. 
Ces mutations sont rares et peuvent conduire a une absence de 
production de apo A-l. 

Des mutations dans les genes codant pour la lipoproteine lipase 
5 (LPL) ou son activateur apoC-ll sont associees avec des 
hypertriglyceridemies severes et des niveaux de HDL-c fortement 
red u its. 

Des mutations dans le gene codant pour I'enzyme lecithine: 
cholesterol, acyltransferase (LCAT) sont egalement associees a une 
10 deficience severe en HDL 

II existe done un besoin croissant dans I'etat de la technique 
d'identifier des genes impliques dans le metabolisme du cholesterol 
et/ou des lipoproteines, et en particulier de genes associes £ des 
dysfonctionnements du transport inverse du cholesterol des cellules 
15 peripheriques vers le foie. 

Recemment, une etude de la segregation de differentes formes 
alleliques de 343 marqueurs microsatellites repartis sur I'ensemble du 
g6nome et distants entre eux en moyenne de 10,3 cM a et6 realis6e. 
20 L'etude de liaison (linkage) a porte sur une famille bien 

caracterisee sur onze generations, dont de nombreux membres sont 
affectes par la maladie de Tangier, la famille comportant cinq lignees de 
consanguinit6. 

25 Cette etude a permis d'identifier une region localis6e dans le locus 

9q31 du chromosome 9 humain statistiquement associe a I'affection 
(Rust S. et al, Nature Genetics, vol. 20, Septembre 1998, pages 96-98). 

Toutefois, I'etude de RUST et al. definit seulement une large 
region du g6nome dont des alterations sont susceptibles d*etre 

30 associees a la maladie de Tangier. II est simplement precise que la 
region du locus 9q31-34 concernee contient des ESTs mais aucun gene 
connu. 

II a desormais 6te montre qu'une region d'environ 15cM situee 
dans le locus 9q31-34 chez Thomme etait associ6e, de maniere 
35 generate, a des deficiences familiales en HDL . 
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Plus particulierement, on a montre selon I'invention que des 
molecules d'ARN messager etaient exprimees a partir de sequences 
localisees dans le genome dans une region d'environ 15 cM centree sur 
le marqueur microsatellite D9S1784, identifie comme le marqueur 

5 microsatellite donnant la liaison genetique la plus forte avec la deficience 
familiale en HDL et la maladie de Tangier. 

De plus, la region 9q31-34 consideree contient potentiellement 
des genes susceptibles de jouer un r6le dans Tinitiation ou le 
developpement de diverses maladies, telles que : 

io - les maladies osseuses comme les chondrosarcomes myxoides, des 
retards mentaux lies aux anomalies du chromosome 9 (MRD) ; 

- les maladies renales comme les nephrophtisies infantiles (NPH2) ; 

- les maladies musculaires, comme la dystrophic musculaire des 
ceintures (LGMD2H) ; 

15 - les maladies psychiatriques comme la schizophrenic ; 

- les maladies digestives comme la maladie de Hirschprung liee a RET 
(SHSCR2). 

Du fait de la localisation des genes candidats positionnels dans 
cette intervalle chromosomique, les ARN messagers et les polypeptides 
20 correspondants. tels qu'isoles et caracterises selon I'invention, sont 
potentiellement impliques dans certaines des pathologies humaines 
decrites ci-dessus, soit encore dans d'autres pathologies egalement 
liees genetiquement a cette region du chromosome 9. 

Pour certaines des sequences comprises dans ces ARN 
25 messagers isolees et caracterisees par le demandeur, une phase de 
lecture ouverte putative a ete determinee et la sequence de la proteine 
correspondante en a ete deduite. Les polypeptides correspondants sont 
potentiellement impliques dans une affection liee au metabolisme des 
lipoproteines, plus particulierement liee a un deficit du transport inverse 
30 du cholesterol. 
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DESCRIPTION DETAILLEE DE L'INVENTION 

La presente invention decrit ainsi des polynucleotides et des 
5 polypeptides dont une alteration de la sequence ou de I'expression est 
potentiellement associee a un deficit dans le metabolisme des 
lipoproteines plasmatiques, plus particulierement a un deficit dans le 
transport inverse des HDL . 

La presente invention decrit aussi des polynucleotides et des 
io polypeptides dont une alteration de la sequence ou de I'expression est 
potentiellement associee d des maladies g6n6tiquement li§es au locus 
9q31-34 du chromosome 9. 

DEFINITIONS GENERALES 

15 

Le terme " isole " au sens de la presente invention designe un 
materiel biologique (acide nucleique ou proteine) qui a 6t6 soustrait a 
son environnement originel (I'environnement dans lequel it est localise 
naturellement). 

20 Par exemple un polynucleotide present a I'etat naturel dans une 

plante ou un animal n'est pas isole. Le meme polynucleotide s6par6 des 
acides nucleiques adjacents au sein desquels il est naturellement insert 
dans le genome de la plante ou Tanimal est considere comme u isole ". 
Un tel polynucleotide peut £tre inclus dans un vecteur et/ou un tel 
25 polynucleotide peut etre inclus dans une composition et demeurer 
neanmoins a I'etat isole du fait que le vecteur ou la composition ne 
constitue pas son environnement naturel. 

Le terme " purifie " ne necessite pas que le materiel soit present 
sous une forme de purete absolue, exclusive de la presence d'autres 
30 composes. II s'agit plutot d'une definition relative. 

Un polynucleotide est a I'etat " purifie " apres purification du 
materiel de depart ou du materiel naturel d'au moins un ordre de 
• ; : grandeur, de preference 2 ou 3 et preferentiejlement 4 ou 5 ordres de 
grandeur. 

35 Aux fins de la presente description, I'expression " sequence 

nucleotidique M peut etre employee pour designer indifferemment un 
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polynucleotide ou un acide nucleique. L'expression " sequence 
nucleotidique " englobe le materiel de genetique lui-meme et n'est done 
pas restreinte a I'information concernant sa sequence. 

Les termes "acide nucleique", "polynucleotide". 
5 " oligonucleotide " ou encore " sequence nucleotidique " englobent des 
sequences d'ARN, d'ADN, d'ADNc ou encore des sequences hybrides 
ARN/ADN de plus d'un nucleotide, indifferemment sous la forme simple 
chalne ou sous la forme de duplex. 

Le terme " nucleotide " designe a la fois les nucleotides naturels 
o (A, T, G. C) ainsi que des nucleotides modifies qui comprennent au 
moins une modification telle que (1) un analogue d'une purine, (2) un 
analogue d'une pyrimidine, ou (3) un sucre analogue, des exemples de 
tels nucleotides modifies etant decrits par exemple dans la demande 
PCT N°WO 95/04 064. 
1 5 Aux fins de la presente invention, un premier polynucleotide est 

considere comme etant " complementaire " d un second polynucleotide 
lorsque chaque base du premier nucleotide est appariee a la base 
complementaire du second polynucleotide dont I'orientation est inversee. 
Les bases complementaires sont A et T (ou a et U). ou C et G. 
20 Par " variant " d'un acide nucleique selon I'invention. on entendra 

un acide nucleique qui differe d'une ou plusieurs bases par rapport au 
polynucleotide de reference. Un acide nucleique variant peut etre 
d'origine naturel, tel qu'un variant allelique retrouve naturellement, ou 
peut etre aussi un variant non naturel obtenu par exemple par des 
25 techniques de mutagenese. 

En general, les differences entre I'acide nucleique de reference et 
I'acide nucleique variant sont reduites de telle sorte que les sequences 
nucleotidiques de I'acide nucleique de reference et de I'acide nucleique 
variant sont tres proches et, dans de nombreuses regions, identiques. 
30 Les modifications de nucleotides presentent dans un acide nucleique 
variant peuvent etre silencieuses, ce qui signifie qu'elles n'alterent pas 
les sequences d'aminoacides codees par ledit acide nucleique variant. 

Cependant, les changements de nucleotides dans un acide 
nucleique variant peuvent aussi resulter dans des substitutions. 
35 additions, deletions dans le polypeptide code par I'acide nucleique 
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variant par rapport aux peptides cod6s par I'acide nucleique de 
reference. En outre, des modifications de nucleotides dans les regions 
codantes peuvent produire des substitutions, conservatives ou non 
conservatives dans la sequence d'aminoacides. 

5 De preference, les acides nucleiques variants selon I'invention 

codent pour des polypeptides qui conservent sensiblement la meme 
fonction ou activite biologique que le polypeptide de I'acide nucleique de 
reference ou encore lacapacite a etre reconnus par des anticorps diriges 
contre les polypeptides codes par I'acide nucleique initial. 

io Certains acides nucleiques variants coderont ainsi pour des 

formes mut6es des polypeptides dont I'etude systematique permettra de 
deduire des relations structure activity des proteines en question. La 
connaissance de ces mutations par rapport a la maladie 6tudi6e est 
fondamentale puisqu'elle permet de comprendre la cause moleculaire de 

15 la pathologie. 

On entendra par "fragment" un acide nucleique de reference 
selon I'invention, une sequence nucleotidique de longueur reduite par 
rapport a I'acide nucleique de reference et comprenant, sur la partie 
commune, une sequence en nucleotides identique a Tacide nucleique de 

20 reference. 

Un tel u fragment " d'acide nucleique selon I'invention peut §tre le 
cas echeant, compris dans un polynucleotide plus grand duquel il est 
constitutif. 

De tels fragments comprennent, ou alternativement consistent en, 
25 des oligonucleotides de longueur allant de 8, 10, 12 t 15, 18, 20 a 25, 30, 
40, 50, 70, 80, 100, 200, 500, 1000 ou 1500 nucleotides consecutifs d'un 
acide nucleique selon I'invention. 

Par u variant " d'un polypeptide selon Tinvention, on entendra 
principalement un polypeptide dont la sequence d'acides amines 
30 contient une ou plusieurs substitutions, additions ou deletions d'au moins 
un residu d'acide amine, par rapport a la sequence d'acides amines du 
polypeptide de reference, etant entendu que les substitutions 
d'aminoacides peuvent etre indifferemment conservatives . ou non 
conservatives. 



WO 00/71710 



10 



PCT/FR00/01426 



Par " fragment " d'un polypeptide selon I'invention, on entendra un 
polypeptide dont la sequence d'acides amines est plus courte que celle 
du polypeptide de reference et qui comprend sur toute la partie 
commune avec ces polypeptides de reference, une sequence en acides 
5 amines identique. 

De tels fragments peuvent, le cas echeant, etre compris au sein 
d'un polypeptide plus grand duquel ils font partie. 

De tels fragments d'un polypeptide selon I'invention peuvent avoir 
une longueur de 10, 15. 20, 30 a 40, 50, 100, 200 ou 300 acides amines. 
io Le " pourcentage d'identite " entre deux sequences de nucleotides 

ou d'acides amines, au sens de la presente invention, peut etre 
determine en comparant deux sequences alignees de maniere optimale, 
a travers une fenetre de comparaison. 

La partie de la sequence nucleotidique ou polypeptide dans la 
is fenetre de comparaison peut ainsi comprendre des additions ou des 
deletions (par exemple des "gaps") par rapport a la sequence de 
reference (qui ne comprend pas ces additions ou ces deletions) de 
maniere a obtenir un alignement optimal des deux sequences. 

Le pourcentage est calcule en determinant le nombre de positions 
20 auquel une base nucleique ou un residu d'aminoacide identique est 
observe pour les deux sequences (nucleique ou peptidique) comparees, 
puis en divisant le nombre de positions auquel il y a identite entre les 
deux bases ou residus d'aminoacides par le nombre total de positions 
dans la fenetre de comparaison, puis en multipliant le resultat par 100 
25 afin d 'obtenir le pourcentage d'identite de sequence. 

L'alignement optimal des sequences pour la comparaison peut 
etre realise de maniere informatique a I'aide d'algorithmes connus 
contenus dans le package de la Societe WISCONSIN GENETICS 
SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 
30 Science Doctor , Madison, WISCONSIN. 

A titre d'illustration. le pourcentage d'identite de sequence pourra 
etre effectue a I'aide du logiciel BLAST (versions BLAST 1.4.9 de mars 
1996, BLAST 2.0.4 de fevrier 1998 et BLAST 2.0.6 de septembre 1998), 
en utilisant exclusivement les parametres par defaut (S. F Altschul et al, 
35 J. Mol. Biol. 1990 215 : 403-410, S. F Altschul et al, Nucleic Acids Res. 
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1997 25: 3389-3402). Blast recherche des sequences 
similaires/homologues a une sequence u requete " de reference, a I'aide 
de I'algorithme d'Altschul et al. La sequence requete et les bases de 
donnees utilisees peuvent etre peptidiques ou nucleiques, toute 
5 combinaison etant possible. 

Par " conditions d'hybridation de forte stringence " au sens de la 
presente invention, on entendra les conditions suivantes : 

I0 1- Competition des membran es et PRE HYBRIDATION : 

- Melanger : 40ul ADN sperme de saumon (10mg/ml) 

+ 40 ul ADN placentaire humain (10mg/ml) 

is - Denaturer 5 mn a 96°C, puis plonger dans la glace le melange. 

- Oter le SSC 2X et verser 4 ml de mix formamide dans le tube 
d'hybridation contenant les membranes. 

20 - Ajouter le melange des deux ADNs denatures. 

- Incubation a 42°C pendant 5 a 6 heures, avec rotation. 
?- Competition de la sonde marquee : 

- Ajouter a la sonde marquee et purifiee 10 a 50 ul ADN Cot I, seldn la 
quantite de repeats. 



30 



- Denaturer 7 a 10 mn a 95°C. 

- Incuber a 65°C pendant 2 a 5 heures. 
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3- HYBRIDATION : 

- Oter le mix de pre hybridation. 

5 

- Melanger 40 \s\ ADN sperme de saumon + 40 pi ADN placentaire 
humain ; denaturer 5 mn a 96°C, puis plonger dans la glace. 

- Ajouter dans le tube d'hybridation 4 ml de mix formamide, le melange 
io des deux ADN et la sonde marquee/ADN Cot I d6natur6e. 

- Incuber 15 a 20 heures a 42°C, avec rotation. 

4- Lavages : 

15 

- Un lavage a temperature ambiante dans du SSC 2X, pour rincer. 

- 2 fois 5 minutes a temp6rature ambiante SSC 2X et SDS 0,1% a 65°C. 

- 2 fois 15 minutes a 65°C SSC 1X et SDS 0,1% a 65°C. 

20 Envelopper les membranes dans du Saran et exposer. 

Les conditions d'hybridation d6crites plus haut sont adaptees a 
I'hybridation dans des conditions de forte stringence, d'une molecule 
25 d'acide nucteique d'une longueur variable de 20 nucleotides a plusieurs 
centaines de nuclfeotides. 

II va sans dire que les conditions d'hybridation ci-dessus decrites 
peuvent etre adaptees en fonction de la longueur de Pacide nucleique 
dont I'hybridation est recherchee ou du type de marquage choisi, selon 
30 des techniques connues de Thomme du m6tier. 
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Les conditions convenables d'hybridation peuvent par exemple 
etre adaptees selon I'enseignement contenu dans I'ouvrage de HAMES 
et HIGGINS (1985) ou encore dans I'ouvrage de F.AUSUBEL et al 
(1999). 

5 

DETAIL DES ACIDES NUCLEIQUES ET DES POLYPEPTIDES SELON 
L'INVENTION 

Une breve description des sequences d'acides nucleiques et des 
io sequences d'acides amines selon I'invention est representee dans te 
Tableau I, a la suite des exemples. 

Gene GS9002S31. 
Acide(s) nucleique(s) 
15 || a ete isole selon I'invention un ARN messager correspondant a 

un transcrit du gene designe ici sous le n° GS9002S31. 

La sequence nucleique de I'ADNc correspondant a ce transcrit 
constitue la sequence SEQ ID N°1. 

La sequence SEQ ID N°1 a une longueur de 552 nucleotides. 
20 Aucune identite de sequence n'a ete retrouvee lors d'une 

recherche dans la base de donnees GenBank (Version 110). 

Les analyses d'expression du transcrit de sequence SEQ ID N°1 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+ de differents tissus ont permis 
25 de montrer que le gene GS9002S31 etait exprime dans le cerveau foetal, 
le foie et le placenta. 
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Gene GS910331. 
Acide(s) nucleique(s) 

It a ete isole selon I'invention deux sequences d'ARN messager 
correspondant a un transcrit du gene designe ici sous le n° GS910331. 
5 La premiere sequence nudeique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°2. 

La sequence SEQ ID N°2 a une longueur de 1246 nucleotides. 
La seconde sequence nudeique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°3. 
io La sequence SEQ ID N° 3 a une longueur de 3035 nucleotides. 

Aucune identite de sequence n'a 6t6 retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110 et Version 
115). 

Les analyses d'expression du transcrit de sequence SEQ ID N°2 
15 ont 6te realises par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS310331 etait exprime dans le cerveau foetal. 

De plus, une analyse de I'expression du transcrit par Northern 
blot, a I'aide respectivement des sondes de sequences SEQ ID N°82 et 
20 83, a revele la presence de transcrits dans le blot commercialise par la 
Societe Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ ID N° 

82 est respectivement de 1 ,65 kb dans le foie et le cceur et de 1 ,4 kb 
dans le cerveau. 

25 La taille des transcrits detectes avec la sonde de sequence SEQ ID N° 

83 est respectivement de 1,65 kb et 2,4 kb dans le cceur et de 1,65 kb 
dans le foie. 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
30 un dysfonctionnement du flux inverse du cholesterol, et plus 
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particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement Me au locus 
9q31-34 du chromosome 9. 

5 GeneGS914554 

Acide(s) nucleique(s) 

II a ete isole selon invention un ARN messager correspondent a 
un transcrit du gene designe ici sous le n° GS94554. 
io La sequence nucleique de PADNc correspondant a ce transcrit 

constitue la sequence SEQ ID N°4. 

La sequence SEQ ID N°4 a une longueur de 1479 nucleotides. 
Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 
1 5 Les analyses d'expression du transcrit de sequence SEQ ID N°4 

ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS94554 etait exprime dans le cerveau foetal, le 
placenta et le foie. 

20 De plus, une analyse de I'expression du transcrit par Northern 

blot, selon le protocole decrit de I'Exemple 1, a Taide respectivement de 
la sonde de sequence SEQ ID N°58 f a r6vel6 la presence de transcrits 
dans le blot commercialise par la Societe Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 

25 ID N°84 est respectivement de : 

- 1,0, 1,3, 1,7 et 2,8 kb dans le pancreas et le placenta ; 

- 1,0, 1,3 et 1,7 kb dans le rein, le muscle squelettique, le coeur et le 
foie ; 

- 1 ,7 kb dans le cerveau et le poumon. 



30 
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Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore 3 une maladie genetiquement Ii6e au locus 
5 9q31-34 du chromosome 9. 

GeneGS914739. 
Acide(s) nucleique(s) 

II a 6t6 isole selon I'invention deux sequences d'ARN messager 
io correspondant a un transcrit du g6ne d£signe ici sous le n° GS14739. 

La premiere sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N 5. 

La sequence SEQ ID N°5 a une longueur de 5169 nucleotides. 
Aucune homologie de sequence avec la sequence SEQ ID N° 5 
15 n'a 6te retrouvee lors d'une recherche dans la base de donnees 
GenBank (Version 110). 

La seconde sequence nuc!6ique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N 6. 

La sequence SEQ ID N°6 a une longueur de 7723 nucleotides. 
20 Cette sequence comprend un cadre ouvert de lecture (ORF) allant du 
nucleotide en position 121 au nucleotide en position 1517 de la 
sequence SEQ ID N° 6. Le codon d'initiation de la traduction debute au 
nucleotide en position 132 de la sequence SEQ ID N° 6. La sequence 
codante debute au nucleotide en position 132 et se termine au 
25 nucleotide en position 1517 de la sequence SEQ ID N° 6. La sequence 
SEQ ID N°6 comprend un signal de polyad£nylation de sequence 
" ATT AAA " debutant au nucleotide en position 7686 de la sequence 
SEQ ID N°6. Le motif de Kozak de. sequence M CCA CTC GCC ATG ' 
• debute au nucleotide en position 123 de la sequence SEQ ID N°6. 

30 
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Deux homologies de sequence de 100% ont et6 retrouvees lors 
d'une recherche dans la base de donnees GenBank (Version 115, N° 
d'acces AF088031), respectivement : 

- du. nucleotide en position 1 au nucleotide en position 146 de la 
5 sequence SEQ ID N°6 ; et 

- du nucleotide en posiiton 243 au nucleotide en position 573 de la 
sequence SEQ ID N° 6 

Les analyses d'expression du transcrit de sequence SEQ ID N°5 
ont ete realisees par RT PCR t comme decrit dans I'Exemple 1. Ces 
io analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS914739 etait exprime dans le cerveau foetal. 

De plus, une analyse de I'expression du transcrit par Northern 
blot, a I'aide de la sonde de sequence SEQ ID N°85, a revele la 
presence de transcrits dans le blot commercialise par la Societe 
15 Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 
ID N°85 est de 1 kb dans le coeur, le foie, le muscle squelettique et le 
rein. 

20 Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement li§e au locus 
9q31-34 du chromosome 9. 

25 

Polypeptide code par I'acide nucleique de sequence SEQ ID N° 6 

Le cadre ouvert de lecture de la sequence nucleotidique SEQ ID 
N° 6 code potentiellement pour un polypeptide de 461 acides amines de 
30 longueur constituant la sequence SEQ ID N° 129. 
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Sur les regions nucleotidiques 240-1481 et 1511- 
1675 de la sequence SEQ ID N° 129, une identite de 
seuqnce d'environ 30% a ete retrouv6e avec dans les 
bases Genpept115, Swissprot38, trEMBL et PIR vace les 
5 numero d'acces suivants : AF035360 (homo), AF1 86461 

(rattus), AF1 86460 (musspretus); AF1 96481 (homo sapiens 
) t AF196480(musmusc) et avec des T09482(homme) et 
T09013(mouse) ( ring finger Fxy ). Quelques homologies de 
sequence ont ete retrouvees egalement avec les numeros 
I0 d'acces suivants : DA191P20.2. A49656 et I49642. 

Le polypeptide de sequence SEQ ID N° 129 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie g6n6tiquement liee au 
I5 locus 9q31-34 du chromosome 9. 

Gene S915574. 
Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
20 un transcrit du gene designe ici sous le n° GS915574. 

La sequence nucl6ique de I'ADNc correspondant a ce transcrit 
constitue la sequence SEQ ID N°7. 

La sequence SEQ ID N°7 a une longueur de 1046 nucleotides. 

Aucune identite de sequence n'a et6 retrouv6e lors d'une 
25 recherche dans la base de donnees GenBank (Version 1 1 0). 

Les analyses depression du transcrit de sequence SEQ ID N°7 
ont 6t6 realises par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le g6ne GS915574 etait exprime dans le cerveau foetal, 
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Puterus, le cerveau, le coeur, la prostate, le foie foetal, le foie, le placenta, 
le testicule et le rein. 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
5 un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d§ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

Gene GS930321 
Acide(s) nucleique(s) 

II a ete isol6 selon Invention un ARN messager correspondant a 
un transcrit du gene design6 ici sous le n° GS930321. 
1 5 La sequence nucleique de I'ADNc correspondant £ ce transcrit 

constitue la sequence SEQ ID N°8. 

La sequence SEQ ID N°8 a une longueur de 280 nucleotides. 
Aucune identite de sequence n'a 6te retrouvee lors d'une 
recherche dans la base de donn6es GenBank (Version 110). 
20 Les analyses depression du transcrit de sequence SEQ ID-N°8 

ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS930321 etait exprime dans le cerveau foetal, 
le foie et le coeur. 

25 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
30 9q31-34 du chromosome 9. 
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GeneS931311. 
Acide(s) nucleique(s) 
5 II a ete isole selon I'invention un ARN messager correspondant a 

un transcrit du gene designe ici sous le n° GS931 31 1 . 

La sequence nucleique de I'ADNc correspondant a ce transcrit 
constitue la sequence SEQ ID N°9. 

La sequence SEQ ID N°9 a une longueur de 479 nucleotides. 
io Cette sequence comprend un cadre ouvert de lecture (ORF) partiel allant 
du nucleotide en position 3 au nucleotide en position 98 de la sequence 
SEQ ID NO 9 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donn^es GenBank (Version 110). 
15 Les analyses d'expression du transcrit de sequence SEQ ID N e 9 

ont ete realisees par RT PCR ( comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS931311 etait exprime dans le cerveau foetal, 
le foie, le cceur, le placenta, le testicule et le rein. 

20 

Ce gene constitue un candidat positionnel causal d'une maladie due d 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore 6 une maladie genetiquement liee au locus 
25 9q31-34 du chromosome 9. 



Polypeptide code par Vacide nucleique de sequence SEQ ID NO 9 
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Le cadre ouvert de lecture partiel de la s6quence d'acides 
nucleique SEQ ID N°9 code potentieilement pour un polypeptide de 32 
aminoacides de longueur constituant la sequence SEQ ID N°130. 

Aucune homologie significative avec BLAST n'a ete retrouvee 
5 avec les sequences ref6renc6es dans les bases de donnees Swissprot 
(version 36, derniere remise 6 jour du 3 mai 1999) et PRODOM: 
(domaines homologues obtenus dans Swissprot, version 34.2, novembre 
1997). 

Le polypeptide de sequence SEQ ID N° 130 est susceptible 
io d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie g£netiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

15 Gene S934660. 

Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designe ici sous le n 6 GS934660. 

La sequence nucl6ique de I'ADNc correspondant a ce transcrit 
20 constitue la sequence SEQ ID N°10. 

La sequence SEQ ID N°10 a une longueur de 2599 nucleotides. 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

Les analyses d'expression du transcrit de sequence SEQ ID N°10 
25 ont ete realisees par RT PGR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS934660 etait exprime dans le cerveau foetal. 

De plus, une analyse de I'expression du transcrit par Northern 
blot, a I'aide de la sonde de sequence SEQ ID N°86, selon le protocole 
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decrit de I'Exemple 1, a revele la presence de transcrits dans le blot 
commercialise par la Societe Clontech (Ref. NT 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 
ID N°86 est respectivement de : 
5 - 1 kb, 2 kb, 3 kb et 7,5 kb dans le placenta ; 

- 2, 3 et 7,5 kb dans le coeur ; 

- 7,5 kb dans le rein, le pancreas, le muscle squelettique, le poumon et 
le cerveau. 

io Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie g6n6tiquement liee au locus 
9q31-34 du chromosome 9. 

15 

Gene GS938315. 
Acide(s) nucleique(s) 

II a et6 isole selon Tinvention un ARN messager correspondent a 
un transcrit du gene designe ici sous le n° GS938315. 
20 La sequence nucleique de I'ADNc correspondant a ce transcrit 

constitue la sequence SEQ ID N°11. 

La sequence SEQ ID N°11 a une longueur de 222 nucleotides. 

Aucune identite de sequence n'a 6t6 retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 
25 Les analyses d'expression du transcrit de s6quence SEQ ID N°11 

ont ete realises par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de diff6rents tissus ont permis 
de montrer que le gene GS938315 etait exprime dans le cerveau foetal, 
le foie, le coeur et le rein. 

30 
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Ce gene constitue un candidat positionnel causal d'une maladie due d 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
5 9q31-34 du chromosome 9. 

Gene GS93953 
Acide(s) nucleique(s) 
io II a ete isole selon Invention deux ARNs 

messagerscorrespondant a un transcrit du gene designe ici sous le n° 
GS93953. 

La premiere sequence nucleique de I'ADNc correspondant £ ce 
transcrit constitue la sequence SEQ ID N°12. 
15 La sequence SEQ ID N°12 a une longueur de 3422 nucleotides. 

Aucune identity de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La seconde sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N° 13. 
20 La sequence SEQ ID N° 13 a une longueur de 5791 nucleotides. 

Elle comprend un cadre ouvert de lecture (ORF) partiel allant du 
nucleotide en position 3 au nucleotide en position 554 de la sequence 
SEQ ID N° 13. 

Quelques homologies de sequence, ont 6t§ retrouvees entre la 
25 sequence SEQ ID N° 13 et les numeros d'acc6s suivants de la base de 
donnees GenBank (Version 116): AC013740.2, AC013783.2 et 
AF086175.1. 

Les analyses depression du transcrit de sequence SEQ ID N°12 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
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analyses effectives a partir d'ARN polyA+de differents tissus ont permis 
de rnontrer que te gene GS93953 etait exprim6 dans le cerveau foetal. 

De plus, une analyse de Expression du transcrit par Northern 
blot, , selon le protocole decrit de I'Exemple 1, a I'aide de la sonde de 
5 s6quence SEQ ID N°87, a revele la presence de transcrits dans le blot 
commercialise par la Soci6t6 Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 
ID N°87 est de 8 kb dans le coeur, le cerveau, le placenta, le poumon, le 
foie, le muscle squelettique, le rein et le pancreas. 

10 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulterement de la maladie de Tangier ou encore des d^ficiences 
familiales en HDL, ou encore a une maladie g6n6tiquement Ii6e au locus 
15 9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID W° 13. 

Le cadre de lecture ouvert partiel de la sequence d'acide 
20 nucleique SEQ ID N°13 code potentiellement pour un polypeptide de 
183 acides amines de longueur constituant la s6quence SEQ ID N° 131. 

II a ete observe une homologie de 45% entre la region 6-162 de 
la sequence SEQ ID N° 131 et la sequence n° g3878571 (Z46381) de la 
base de donn6es Gen Bank (Version 115) et la sequence n<° 
25 ■ EM:Q21453 M01F1.4 PROTEIN de la base de donnees trEMBL 
(Version de Aout 1999). 

Le polypeptide de sequence SEQ ID N° 131 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des d6ficiences 



WO 00/71710 



25 



PCT/FROO/01426 



familiales en HDL, ou encore dans une maladie genetiquement liee au 
locus 9q31-34 du chromosome 9. 

Gene GS939874. 
5 Acide(s) nucteique(s) 

II a ete isole selon ('invention deux ARNs messagers 
correspondant a un transcrit du gene designe ici sous le n° GS939874. 

La premiere sequence nucl6ique de TADNc correspondant d ce 
transcrit constitue la sequence SEQ ID N°14. 
io La sequence SEQ ID N°14 a une longueur de 2615 nucleotides. 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La deuxieme sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N° 15. 
1 5 La sequence SEQ ID N° 15 a une longueur de 2551 nucleotides. 

Elle comprend un cadre ouvert de lecture allant du nucleotide en position 
50 au nucleotide en position 958 et une sequence codante allant du 
nucleotide en position 67 au nucleotide en position 958. 

Une homologie de 99% d'identite sur 2044 nucleotides de la 
20 sequence SEQ ID N° 15 a ete observee avec la sequence de la base de 
donnees GenBank (Version 116) ayant le numero d'acces AK001355. 

Les analyses depression du transcrit de sequence SEQ ID N°14 
ont 6te realisees par RT PGR, comme decrit dans TExemple 1. Ces 
analyses effectuees a partir d'ARN po!yA 4 de differents tissus ont permis 
25 de montrer que le gene GS939874 etait exprim6 dans le cerveau foetal, 
Tuterus, le cerveau, le cceur, la prostate, le foie foetal, le foie, le placenta, 
le testicule et le rein. 

Ce g6ne constitue un candidat positionnel causal d f une maladie 
30 due a un dysfonctionnement du flux inverse du cholesterol, et plus 
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particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

5 Polypeptide code par Vacide nucleique de sequence SEQ ID N° 15. 

Le cadre ouvert de lecture de I'acide nucleique de sequence SEQ 
ID N° 15 code potentiellement pour un polypeptide de 291 acides 
amines de longueur constituant la sequence SEQ ID N° 132. 
10 Une homologie de 35% sur 233 acides amines (14-246 de SEQ 

ID N° 132) a ete retrouvee avec la sequence referencee dans la base de 
donnees GenPept (Version 115) sous le n° g5832945 (AL1 17195). 

Une homologie de 32% sur 245 acides amines (30-274 de SEQ 
ID N° 132) a 6t6 retrouvee avec la sequence ref6rencee dans la base de 
15 donnees GenPept (Version 115) sous le n° g5832942 (AL1 17195). 

Le polypeptide de sequence SEQ ID N Q 132 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
20 familiales en HDL, ou encore dans une maladie genetiquement liee au 
locus 9q31-34 du chromosome 9. 

Gene GS911370 
Acide(s) nucleique(s) 

25 

II a 6t6 isote selon I'invention un ARN messager correspondent & 
un transcrit du gfene design^ ici sous le n° GS911370. 

La sequence nucleique de I'ADNc correspondant a ce transcrit 
constitue la sequence SEQ ID N°16. 
30 La sequence SEQ ID N°16 a une longueur de 775 nucleotides. 
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Cette sequence comprend un cadre ouvert de lecture partiel 
(ORF) allant du nucleotide en position 1 au nucleotide en position 144 de 
la sequence SEQ ID N°16. 

Une homologie en nucleotides a ete retrouvee avec les 
5 sequences suivantes : 

• 96% d'homologie sur 229 pb (position 52-280 pb) avec la 
sequence GenBank: gi|1022224| - Fragment Mse1 

io d'ADN genomique d'Homo sapiens, contenant un ilot 

CpG ( clone 92e10, lecture inverse de cpg92e10.rt1a) 

• 100% d'homologie sur 145 pb (position 1-144 pb) avec la 
sequence GenBank: gi|459833| de PARNm humain de la 

1 5 sous unite beta du complexe Sec61. 

Les analyses d'expression du transcrit de sequence SEQ ID NT 16 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectu6es a partir d'ARN polyA + de differents tissus ont permis 
20 de montrer que le gene GS91 1 370 etait exprime dans le cerveau foetal. 

De plus, une analyse de I'expression du transcrit par Northern 
blot, selon le protocole decrit de I'Exemple 1 , a I'aide respectivement des 
sondes de sequence SEQ ID N° 88 et 89, a r6v6l6 la presence de 
transcrits dans le blot commercialise par la Soci6t§ Clontech (Ref. N° 
25 7 7 59-1). 

La taille des transcrits d6tect6s avec la sonde de sequence SEQ 
ID N° 88 ainsi qu'avec la sonde de sequence SEQ ID N°89 est de 7,4 
kb dans le pancreas. 

30 Ce g§ne constitue un candidat positionnel causal d'une maladie 

due a un dysfonctionnement du flux inverse du cholesterol, et plus 
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particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie gSnetiquement Itee au locus 
9q31-34 du chromosome 9. 

5 Polypeptide code par I'acide nucleique de sequence SEQ ID N° 16 

Le cadre ouvert de lecture partiel de la sequence decides 
nucieiques SEQ ID N°16 code potentiellementpour un polypeptide de 48 
aminoacides de longueur constituant la sequence SEQ ID N°133. 

io Homologies observees au niveau de la sequence prot6ique : 

Cette ORF potentielle (48 aa) possede une identite sur 33 aa (position 
16-48 aa) avec la proteine de transport sous unite beta du complexe 
Sec61 humaine dont les sequences sont sp|P38301|, gb|AAA1 9639.1 1. 
PIR: (Sequences PIR non redondantes, version 57)|S|S42410 et 18652 

15 p34.2 (1) respectivement dans les bases de donnees Swissprot (version 
36, derniere remise a jour du 3 mai 1999))Genpept: (traduction de 
Genbank v110 et 111, derniere remise a jour le 7 mai 1999), PIR: 
(SEQUENCES PIR NON REDONDANTES, VERSION 57) non- 
redondante et PRODOM: (domaines homologues detectes dans 

20 Swissprot, version 34.2, novembre 1997). 

Cette identite est retrouvee dans les differentes bases de 
donnees proteiques ( PIR: (SEQUENCES PIR NON REDONDANTES, 
VERSION 57), PRODOM: (domaines homologues d6tect6s dans 
Swissprot, version 34.2, novembre 1997)) et les traductions de Genbank 

25 et EMBL (TrEMBL (SP-TrEMBL, version 7, novembre 1998), Genpept: 
(traduction de Genbank v110 et 111, dernfere remise £ jour le 7 mai 
1999)). 

Fonction putative : 

Le complexe de proteines sec61 est un composant central de la 
30 machinerie cellulaire de translocation des proteines naissantes dans le 
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reticulum endoplasmique. Le gene GS911370 pourrait done etre, de part 

son homologie avec la sous unite beta du complexe sec61. un gene 

codant pour un nouveau composant de cette machinerie. Par 

consequent son role possible dans la translocation des prot6ines et par 
5 consequent du trafic des proteines impliquees dans le m6canisme 

d'efflux du cholesterol en fait un gene d'interet dans T6tude du deficit 

observee chez les patients Tangier/FHD. 

Le polypeptide de sequence SEQ ID N°133 est ainsi susceptible 

d'intervenir dans la regulation du flux de cholesterol, et plus 
io particulierement de la maladie de Tangier ou encore des d6ficiences 

familiales en HDL. 

Le polypeptide de sequence SEQ ID N133 est done susceptible 

d'intervenir dans une etape importante impliquee dans le transport 

inverse du cholesterol par les HDL. 
15 Le polypeptide de sequence SEQ ID N° 133 est egalement 

susceptible d'intervenir dans une maladie genetiquement liee au locus 

9q31-34 du chromosome 9. 

Gene GS913920. 
20 Acide(s) nucleique(s) 

II a ete isol6 selon Tinvention un ARN messager correspondent a 
un transcrit du gene design^ ici sous le n° GS913920. 

Une premiere sequence a ete isolee et caract6ris6e ; il s'agit de la 
sequence nucl6ique de TADNc constituant la sequence SEQ ID N°17. 
25 La sequence SEQ ID N°17 a une longueur de 491 nucleotides. 

Aucune identite de sequence n'a 6t6 retrouv6e lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

30 Les analyses d'expression du transcrit de sequence SEQ ID N°17 

ont ete realisees par RT PCR t comme decrit dans TExemple 1. Ces 
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analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le g6ne GS913920 etait exprim6 dans le foie et Je coeur. 

A partir de la sequence SEQ ID N° 1 7, deux amorces 
nucleotidiques respectivement de sequences SEQ ID N° 102 et SEQ ID 
5 N° 103 ont et6 synth&isees. Ces amorces nucleotidiques ont permis 
d'amplifier un ADNc du gene GS913920 constituant la sequence SEQ ID 
N° 18. 

Les reactions d'amplification sont r^alisees dans les conditions 
suivantes, applicables a I'ensemble des genes candidats selon 

io Tinvention pour lesqueles des amorces specifiques sont d6crites et 
mises en oeuvre pour isoler des sequences du transcrit d'interet : 

Chaque reaction de PCR est effectuee avec 400 pM de chaque 
dNTP, 0.5 pM de chaque amorce, 2.5 mM de MgCI2, 50 ng d'ADN ou 
environ 25 ng d'ADNc et 2 unites de Thermus aquaticus (Taq) DNA 

15 polymerase (Ampli Taq Gold; Perkin Elmer) en presence de son tampon. 
Les reactions sont realisees en micro-plaques 96 puits, dans des 
thermo-cycleurs 9700 (Perkin Elmer). Apres une premiere denaturation a 
94°C pendant 10 min, un programme de 30 cycles est appliqu6 : 
denaturation de 30 s. a 94°C, hybridation de 30 s. & 64°C (2 cycles), 

20 61 °C (2 cycles), 58°C (2 cycles) et 55°C (28 cycles), elongation de 1 
min/kb a 72°C. Le programme s'acheve par une elongation de 7 min a 
72°C. 

La sequence nucl§ique SEQ ID N° 18 a une longueur de 293 
25 nucleotides. Elle comprend un cadre de lecture ouvert (ORF) partiel 
allant du nucleotide en posiiton 227 au nucleotide en position 293. 
Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du f\ux inverse du cholesterol, et plus 
particulieremeht de la maladie de Tangier ou encore des deficiences 
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familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 18 

5 

Le cadre ouvert de lecture de la sequence d'acides nucl6iques 
SEQ ID N°18 code potentiellement pour un polypeptide de 22 
aminoacides de longueur constituant la sequence SEQ ID N°134. 

Aucune homologie significative avec BLAST n'a ete retrouvee 
io avec les sequences referencees dans les bases de donnees Genpept: 
(traduction de Genbank v115), TrEMBL (SP-TrEMBL, Version AoQt 
1999), Swissprot (Version 38) et PIR: (SEQUENCES PIR NON 
REDONDANTES, Version 62-Septembre 1999). 

Le polypeptide de sequence SEQ ID N°134 est susceptible 
15 d'intervenir dans la regulation du flux de cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL. 

Le polypeptide de sequence SEQ ID N°134 est done susceptible 
d'intervenir dans une etape importante impliqu^e dans le transport 
20 inverse du cholesterol par les HDL. 

Le polypeptide de sequence SEQ ID N° 134 est egalement 
susceptible d'intervenir dans une maladie g6n6tiquement liee au locus 
9q31-34 du chromosome 9. 

25 Gene GS91437. 

Acide(s) nucleique(s) 

II a ete isole selon I'invention deux ARNs messagers 
correspondant a un transcrit du gene designe ici sous le n° GS91437. 

La premiere sequence nucleique de I'ADNc correspondant a ce 
30 transcrit constitue la sequence SEQ ID N°19. 
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La sequence SEQ ID N°19 a une longueur de 2442 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 2 au nucleotide en position 286 de 
la sequence SEQIDNT19. 
5 Aucune identity de s6quence n'a 6t6 retrouv6e lors d'une 

recherche dans la base de donnees GenBank (Version 110). 

La seconde sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N° 20. 

La sequence SEQ ID N°20 a une longueur de 4608 nucleotides. 
10 Elle comprend un cadre ouvert de lecture (ORF) partiel allant du 
nucleotide en position 1 au nucleotide en position 327. 

II a ete trouv6 les homologies de sequence suivantes dans la 
base de donnees GenBank (Version 116) avec la sequence SEQ Id N° 
20: 

is • 100% d'homologie sur 213 pdb (positions [85-297]) avec les 
positions [2807-2595] de la sequence g7020279 (AK000294) Homo 
sapiens cDNA FLJ20287 fis, clone HEP04390 Length = 3043; 
deposee le 22-02-2000 dans Genbank. 
• 88% sur 219 pdb (positions [82-300]) avec la sequence g3850048 

20 (AJ 004828) Mus musculus clone XX-BAC394, Length = 170351*** 
SEQUENCING IN PROGRESS ***, in unordered pieces; 

Les analyses depression du transcrit de s6quence SEQ ID N°19 
ont ete realisees par RT PGR, comme decrit dans I'Exemple 1. Ces 
25 analyses effectuees a partir d'ARN polyA + de differents tissus ont permis 
de montrer que le gene GS91437 etait exprim6 dans le cerveau foetal, le 
foie, le cceur, la prostate, le placenta, I'uterus, le testicule, le rein, le 
muscle squeletttique. 

30 Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
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familiales en HDL'ou encore a une maladie genetiquement Itee au locus 
9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID N°19 

5 

Le cadre ouvert de lecture partiel de la sequence d'acides 
nucleiques SEQ ID N°19 code potentiellement pour un polypeptide de 95 
aminoacides de longueur constituant la sequence SEQ ID N°135. 

Aucune homologie significative avec BLAST n'a 6t6 retrouv6e 

10 avec les sequences referencees dans les bases de donnees Swissprot 
(version 36, derniere remise a jour du 3 mai 1999), PRODOM: 
(domaines homologues detectes dans Swissprot, versions 34.2 et 
38,)Genpept: (traduction de Genbank v110 et 111 ainsi que 115,). PIR: 
(SEQUENCES PIR NON REDONDANTES, VERSION 57), PDB: 

15 (PROTEIN DATA BANK, FEVRIER 1999) et TrEMBL (SP-TrEMBL, 
version 7, novembre 1998). 

Le polypeptide de sequence SEQ ID N° 135 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 

20 familiales en HDL, ou encore dans une maladie genetiquement liee au 
locus 9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID N Q 20 

25 Le cadre ouvert de lecture (ORF) contenu dans I'acide nucleique 

de sequence SEQ ID N° 20 code potentiellement pour un polypeptide de 
108 acides amines constituant la sequence SEQ ID N° 136. 

Aucune homologie de sequence n'a 6t6 retrouve avec les bases 
de deonnees Swissprot (Version 38), Genpept (Version 115), PIR 

30 (Version 62, Septembre 1999) et trEMBL (Version de Aout 1999). 
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Le polypeptide de sequence SEQ ID N° 136 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulterement de la. maladie de Tangier, dans des dSficiences 
familiales en HDL, ou encore dans une maladie genetiquement liee au 
5 locus 9q31-34 du chromosome 9. 

Gene GS91507. 
Acide(s) nucleique(s) 

io II a et6 isole selon I'invention deux ARNs messagers 

correspondant a un transcrit du gene design6 ici sous le n° GS91507. 

La premiere sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°21. 

La sequence SEQ ID N°21 a une longueur de 1627 nucleotides. 
15 Cette sequence comprend un cadre ouvert de lecture (ORF) 

partiel allant du nucleotide en position 1 au nucleotide en position 640 de 
la sequence SEQ ID N°21. 

Aucune identite de sequence n'a 6t6 retrouv6e lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

20 La deuxieme sequence nucteique de I'ADNc correspondant 3 ce 

transcrit constitue la sequence SEQ ID N° 22. 

La sequence SEQ ID N° 22 a une longueur de 2333 nucl6otides. 
Elle comprend un cadre ouvert de lecture (ORF) complet allant du 
nucleotide en position 368 au nucleotide en position 1348. Le d§but du 

25 codon d'initiation de la traduction est localise sur le nucl6otide en 
position 371 de la sequence SEQ ID N° 22. La sequence codante 
d6bute au nucleotide en position 371 et se termine au nucleotide en 
position 1348. 

so La sequence SEQ ID N° 22 possede une homologie avec la 

sequence suivante referencee dans la base de donnees GenBank 
(Version 116) suivante : 
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Identite nucleique de 99% sur 2316 pb (position 115 a 2420 pb) 
avec Homo sapiens cDNA FLJ20300 fis, clone HEP06465 ( 2331 
pb). Accession AK000307 

5 

Les analyses d'expression du transcrit de sequence SEQ ID N°21 
ont 6t6 realis6es par RT PCR, comme decrit dans TExemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS91507 etait exprim6 dans le cerveau foetal. 

io De plus, une analyse de I'expression du transcrit par Northern 

blot, selon le protocole decrit de I'Exemple 1, a I'aide de la sonde de 
sequence SEQ ID N°90, a rev6!6 la presence de transcrits dans le blot 
commercialise par la Society Clontech (Ref. N° 7759-1). 

La taille des transcrits d§tect6s avec la sonde de sequence SEQ 

15 ID N°90 est respectivement de : 

- 2 kb et 7,5 kb dans le pancreas, le rein, le muscle squelettique, le 
poumon, le placenta et le cerveau. 

Ce gene constitue un candidat positionnel causal dune maladie 
20 due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL. 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 21 
25 Le cadre ouvert de lecture de la sequence d'acides nucteiques 

SEQ ID N°21 code potentiellement pour un polypeptide de .213 

aminoacides de longueur constituant la sequence SEQ ID N°137. 
Homologies observees au niveau de la sequence prot6ique: 

Cette ORF potentielle de 213 aa possede un domaine ayant des 
30 homologies de type motif avec differentes prolines telles que : 
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• 29% d'homologie sur 155 aa (position 4-158 aa) avec 
des sequences de Swissprot (version 36, derntere 
remise a jour du 3 mai 1999) sp|Q10022| et avec des 
sequences de PRODOM: (domaines homologues 

5 detectes dans Swissprot, version 34.2, novembre 1997) 

28705 p34.2 (1) YSX3_CAEEL - domaine de la proline 
hypoth&ique (39KD) T28D9.3 localis6 sur le 
chromosome II. 

• 25% d'homologie sur 127 aa (position 6-132 aa) avec 
10 des sequences de PIR: (SEQUENCES PIR NON 

REDONDANTES, VERSION 57) non-redondante: PIR: 
(Sequences PIR non redondantes, version 57)|S|S66668 
- proteine induite par le peroxyde d'hydrog^ne - 
(fragment d'une sequence de souris). 

15 

De plus, des homologies avec des sequences codantes traduites 
de Genbank et EMBL (TrEMBL (SP-TrEMBL, version 7, novembre 
1998), Genpept: (traduction de Genbank v110 et 111, derntere remise d 
jour le 7 mai 1999)) montreraient des annotations avec des proteines 
20 potentielles de type " acide phosphatidique phosphatase " 

• 34% d'homologie sur 200 aa (position 6-205 aa) avec 
des sequences de SP-TrEMBL (SP-TrEMBL f version 7, 
novembre 1998): sp|P97544|P97544 - proteine 

25 transmembranaire du reticulum endoplasmique. 

• 33% d'homologie sur 204 aa (position 6-209 aa) avec 
des sequences de Genpept: (traduction de Genbank 
v110 et 111, derni&re remise £ jour le 7 mai 1999): 

30 gi|4105139|- acide phosphatidique phosphatase-beta, 
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type2 ; phosphatidate phosphohydrolase ; phospholipide 
phosphatase chez I'Homme. ; et avec des sequences 
de Genpept: (traduction de Genbank v110 et 111, 
derniere remise £ jour le 7 mai 1999): gi|3047173| 
5 homologue de Tacide phosphatidique phosphohydrolase 

de I'Homme, et avec gi|2467300| |- acide phosphatidique 
phosphatase 2b. 

• 31% d'homologie sur 203 aa (position 6-208 aa) avec 
10 des sequences de Genpept: (traduction de Genbank 

v110 et 111, derntere remise £ jour le 7 mai 1999): 
gi|1487873||- acide phosphatidique phosphatase de 
souris 

I5 • 31% d'homologie sur 203 aa (position 6-208 aa) avec 

des sequences de SP-TrEMBL (SP-TrEMBL, version 7, 
novembre 1998): sp|Q61469|Q61469 |- acide 
phosphatidique phosphatase 2A 

20 Polypeptide code par I'acide nucleique de sequence SEQ ID N° 22. 

Le cadre ouvert de lecture de la sequence d'acide nucleique SEQ 
ID N°22 code potentiellement pour un polypeptide de 325 aminoacides 
de longueur constituant la s6quence SEQ ID N°138. 
25 Homologies observees au niveau de la sequence proteique 

Homologies avec des sequences codantes traduites de Genbank 
(Version 116) et EMBL (TrEMBL (Version de AoOt 1999), Genpept 
[Version 115]) montreraient des annotations avec des proteines 
potentielles de type " acide phosphatidique phosphatase \ 
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• 30% d'homologie sur 316 aa (position 2-317 aa) avec 
SP-trEMBL: sp|P97544|P97544 ER TRANSMEMBRANE 
PROTEIN 

• 30% d'homologie sur 320 aa (position 2-32 1aa) avec 
5 Genpept116 gi|4105139|AF043329 type-2 phosphatidic 

acid phosphatase-beta; phosphatidate 

phosphohydrolase; phospholipid phosphatase [Homo 
sapiens] et avec Genpept116: gi|30471 73|AF01 786 
phosphatidic acid phosphohydrolase homolog [Homo 
io sapiens] et avec gi|2467300|AB000889 phosphatidic 

acid phosphatase 2b 

• 30% d'homologie sur 316 aa (2-317 aa) 
avecGenpept116 gi 1684745 Y07783 transmembrane 
protein [Rattus norvegicus] Length = 312 aa 

15 

• 30% d'homologie sur 320 aa (position 2-317 aa) avec 
SP-trEMBL EM:014495 PHOSPHATIDIC ACID 
PHOSPHATASE 2B. Length = 311 aa 

20 

Fonction putative des polypeptides de sequence SEQ ID N° 137 

et138: 

Le gene GS91507 presente un interet pour I'^tude fonctionelle de la 
maladie de Tangier et du FHD en ce sens qu'il s'agit £ la fois d'un 
25 candidate positionnel et d'un gene codant pour une nouvelle proline 
dont les fonctions putatives (phosphatidic acid phosphatase) pourraient 
jouer un role dans la cascade de signalisation intracellular li§e a I'efflux 
du cholesterol intracellular m6dte par les particules HDL ( impliqu6 dans 
la maladie de Tangier et la deficience familiale en HDL (FHD). 
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Les polypeptides de sequence SEQ ID N° 137 et 138 est 
susceptible d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie genetiquement Ii6e au 
5 locus 9q31-34 du chromosome 9. 

Gene GS915231. 
Aclde(s) nucteique(s) 

II a ete isole selon I'invention deux ARNs messagers 
10 correspondant £ un transcrit du gene designe ici sous le n° GS915231. 

La premiere sequence nucieique de I'ADNc correspondant £ ce 
transcrit constitue la sequence SEQ ID N°23. 

La sequence SEQ ID N°23 a une longueur de 2764 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
15 partiel allant du nucleotide en position 3 au nucleotide en position 1220 
de la sequence SEQ ID N°23. 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La deuxieme sequence nucieique de I'ADNc correspondant d ce 
20 transcrit constitue la sequence SEQ ID N° 24. 

La sequence SEQ ID N° 24 a une longueur de 3228 nucleotides 
Elle comprend un cadre ouvert de lecture (ORF) allant du nucleotide en 
position 37 au nucleotide en position 1304. La sequence codante debute 
au nucleotide en position 49 et se termine au nucleotide en position 
25 1304 de la sequence SEQ ID N° 24. Le debut du codon d'initiation de la 
traduction est localise sur le nucleotide en position 49. II existe un signal 
de polyadenylation debutant sur le nucleotide en position 3142 de la 
sequence SEQ ID N° 24. 

Des homologies de sequence ont ete observees entre la 
30 sequence SEQ ID N° 24 et les sequences suivantes ref6renc6es dans la 
base de donnees GenBank (Version 116) : 
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• 100% d'homologie sur 217 pdb (positions [2704-2920]) matchant 
.avec les positions [1-217] de la sequence g4884337 (AL050130) 
Homo sapiens mRNA; cDNA DKFZp586H051 (from clone 
DKFZp586H051). Length = 1795; deposee le 18-FEB-2000; Direct 

5 Submission ; Submitted (15-MAY-1999) MIPS, Am Klopferspitz 18a, 
D-821 52, Martinsried, GERMANY, 

• 4 fragments d'homologie : 100%sur 393 pdb [2773-3165]; 100% sur 
153 pdb [913-1065]; 100% sur 111 pdb [1083-1193]; 84% sur 84 pdb 

10 [2341-2424] avec la sequence g6539402(AC0 16904) Homo sapiens 
clone RP11-307P9, *** SEQUENCING IN PROGRESS 36 
unordered pieces. Length = 203456; 

• Differents fragments d'homologie : 83% sur 258 pdb [529-786]; 89% 
I5 sur 66pdb [1195-1260]; 80% sur 185pdb [91-275] avec la sequence 

g5305227 (AF029260) Gallus gallus transcription factor RelB (relb) 
mRNA, complete cds. Length = 2851 

Les analyses d'expression du transcrit de sequence SEQ ID N°23 
20 ont ete realisees par RT PCR, comme d6crit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS915231 6tait exprim6 dans le cerveau foetal. 

De plus, une analyse de I'expression du transcrit par Northern 
blot, selon le protocole decrit de TExemple-l, a I'aide de la sonde de 
25 sequence SEQ ID N°91, a revele la presence de transcrits dans le blot 
commercialise par la Societe Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de s6quence SEQ 
ID N°91 est respectivement de : 

- 1,3 kb, 2 kb, 4 kb, 4,4 kb et 7,5 kb dans le coeur.et le muscle 
30 squelettique : 
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- 1,3 kb, 2 kb, 4 kb et 4,4 kb dans le foie et le rein ; 
- 1,3 kb, 2 kb, 4,4 kb et 7,5 kb dans le cerveau ; 
- 1 ,3 kb, 2 kb et 4,4 kb dans le pancreas. 

5 Ce g£ne constitue un candidat positionnel causal d'une maladie due d 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou'encore a une maladie gen6tiquement Ii6e au locus 
9q31-34 du chromosome 9. 

10 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 23 

Le cadre ouvert de lecture partiel de la sequence d'acides 
nucl6iques SEQ ID N°23 code potentiellement pour un polypeptide de 
406 aminoacides de longueur constituant la sequence SEQ ID N°139. 
15 Homologies observees au niveau de la sequence proteique : 

• 51% d'homologie avec des sequences de Genpept: 
(traduction de Genbank v110 et 111, derniere remise a 
jour le 7 mai 1999): gi:2731377 est la traduction 

20 proteique de la sequence gb|AAB93456.1| (U28739) 

similaire a I'alcool deshydrogenase/ribitol 
dehydrogenase de C. elegans et des sequences de 
SP-TrEMBL (SP-TrEMBL, version 7, novembre 
1998):Q09979 sur401 aa (position 1-401 aa). 

25 

• 30% d^omologie sur 164 aa (position 47-205 aa) avec 
les sequences de Protein Data Bank:: gi|1 82771 3| 
correspondant a la proteine 1AHI|A Chain A, 7 Alpha- 
Hydroxysteroid Dehydrogenase Complexed With Nadh 

30 And 7-Oxo Glycochenodeoxycholic Acid et avec 
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gi|1827714| correspondant a la prot6ine 1AHI|B Chain B, 
7 Alpha-Hydroxysteroid Dehydrogenase Complexed 
With Nadh And 7-Oxo Glycochenodeoxycholic Acid et 
avec gi|1827715| correspondant a la proline 1AHH|A 
Chain A, 7 Alpha-Hydroxysteroid Dehydrogenase 
Complexed With A/ad+ et avec gi| 1 8277 1 6| 
correspondant a la proline 1AHH|B Chain B, 7 Alpha* 
Hydroxysteroid Dehydrogenase Complexed With A/ad+ 
et avec gi|1943533| correspondant a la proteine 1FMC|A 
Chain A, 7-Alpha-Hydroxysteroid Dehydrogenase 
Complex With Nadh And 7-Oxo Glycochenodeoxycholic 
Acid et avec gi|1943534| correspondant d la proteine 
1 FMC|B Chain B, 7-Alpha-Hydroxysteroid 
Dehydrogenase Complex With Nadh And 7-Oxo 
Glycochenodeoxycholic Acid 

29% d'homologie sur 131 aa (position 53-183 aa) avec 
des sequences de Protein Data Bank: gi|2624497| 
correspondant a la proteine Cis-Biphenyl-2,3~ 
Dihydrodiol*2 ^-Dehydrogenase de Pseudomonas Sp. 
Lb400 

27% d'homologie sur 194 aa (position 3-196 aa) avec 
des s6quences de la base PIR: (SEQUENCES PIR NON 
REDONDANTES, VERSION 57): PIR: (Sequences PIR 
non redondantes, version 57)|D69930| correspondant a 
la proteine 3-oxoacyI- acyl-carrier protein reductase 
homolog yoxD de - Bacillus subtilis et avec des 
sequences de Swissprot (version 36, derni6re remise a 
jour du 3 mai 1999): sp|P14802| correspondant a la 
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proteine YOXDJ3ACSU - oxidorecluctase hypothetique 
presente dans ia region RTP-PELB (ORF238) 



5 • 52% d'homologie sur 44 aa (position 353-396 aa) avec 

des sequences de PRODOM: (domaines homologues 
detectes dans Swissprot, version 34.2 ( novembre 1997) 
(homologous domains detected in Swissprot (version 36, 
derniere remise a jour du 3 mai 1999)): 2675 p34.2 (11) 

io NLTP(5) DHB4(3) PX18(2) correspondant d la proteine 

LIPID-TRANSFER STEROL CARRIER SCP-2 
NONSPECIFIC PRECURSOR ESTRADIOL BETA- 
DEHYDROGENASE 1 7-BETA-HYDROXYSTEROID 



• 27% d'homologie sur 167 aa (position 233-399 aa) avec 
des sequences de Swissprot (version 36, derntere 
remise a jour du 3 mai 1999) : sp|P51659| correspondant 
a la proteine DHBAJiUMAN ESTRADIOL 17 BETA- 
DEHYDROGENASE 4 (EC 1.1.1.62) (17-BETA-HSD 4) 
(1 7-BETA-HYDROXYSTEROID DEHYDROGENASE 4) 



Polypeptide code par I'acide nucleique de sequence SEQ ID Af° 24 

Le cadre ouvert de lecture (ORF) de la sequence decide 
nucleique SEQ ID N° 24 code potentiellement pour un polypeptide de 
25 4 22 acides amines de longueur constituant la s6quence SEQ ID N° 140. 
Les homologies de sequences suivantes ont ete retrouvees : 
Homologies observees au niveau de la sequence prot&ique : 

• 51% d'homologie avec Genpept: gi:2731377 et SP- 
trEMBL:Q09979 sur 416 aa (position 11-417 aa). 
30 Genpept: gi:2731377 est la traduction proteique de la 
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sequence gb|AAB93456.1| (U28739) similaire a I'alcool 
deshydrogenase/ribitol dehydrogenase de C. elegans 

30% d'homologie sur 164 aa (position 47-205 aa) avec 
Protein Data Bank: gi|1827713| correspondant £ la 
prot6ine 1AHI|A Chain A, 7 Alpha-Hydroxysteroid 
Dehydrogenase Complexed With Nadh And 7-Oxo 
Glycochenodeoxycholic Acid et avec gi|1827714| 
correspondant £ la prot6ine 1AHI|B Chain B, 7 Alpha- 
Hydroxysteroid Dehydrogenase Complexed With Nadh 
And 7-Oxo Glycochenodeoxycholic Acid et avec 
gi|1827715| correspondant a la proteine 1AHH|A Chain 
A ( 7 Alpha-Hydroxysteroid Dehydrogenase Complexed 
With Nad+ et avec gi| 1827716) correspondant a la 
proteine 1AHH|B Chain B, 7 Alpha-Hydroxysteroid 
Dehydrogenase Complexed With Nad+ et avec 
gi| 1943533| correspondant a la proteine 1FMC|A Chain 
A ( 7-Alpha-Hydroxysteroid Dehydrogenase Complex 
With Nadh And 7-Oxo Glycochenodeoxycholic Acid et 
avec gi|1 943534] correspondant a la proteine 1FMC|B 
Chain B, 7-Alpha-Hydroxysteroid Dehydrogenase 
Complex With Nadh And 7-Oxo Glycochenodeoxycholic 
Acid 

29% d'homologie sur 131 aa (position 53-183 aa) avec 
Protein Data Bank: gi|2624497| correspondant d la 
proteine Cis-Biphenyl-2.3-Dihydrodiol-2.3- 
Dehydrogenase From Pseudomonas Sp. Lb400 
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27% d'homologie sur 202 aa (position 6-212 aa) avec 
Non redundant PIR: pir|D69930| correspondant a la 
protein e 3-oxoacyl- acyl-carrier protein reductase 
homolog yoxD - Bacillus subtilis et avec Swissprot: 
sp|P14802| correspondant a la proteine YOXD_BACSU 
HYPOTHETICAL OXIDOREDUCTASE IN RTP-PELB 
INTERGENIC REGION (EC 1 .-.-.-) (ORF238) 

52% d'homologie sur 44 aa (position 353-396 aa) avec 
Prodom (homologous domains detected in Swissprot): 
2675 p34.2 (11) NLTP(5) DHB4(3) PX18(2) 
correspondant a la proteine LIPID-TRANSFER STEROL 
CARRIER SCP-2 NONSPECIFIC PRECURSOR 
ESTRADIOL BETA-DEHYDROGENASE 17-BETA- 
HYDROXYSTEROID 

27% d'homologie sur 183 aa (position 249-415 aa) avec 
Swissprot : sp|P51659| correspondant a la proteine 
DHB4_HUMAN ESTRADIOL 17 BETA- 
DEHYDROGENASE 4 (EC 1.1.1.62) (17-BETA-HSD 4) 
( 1 7-BETA-H YD ROXYSTERO I D DEHYDROGENASE 4) 

44% d'homologie sur 272 AA ( positions 12-280 AA ) 
avec la sequence g2072661 (Z95120) hypothetical 
protein Rv3224 [Mycobacterium tuberculosis] Length = 
282 

Homologie avec des NONSPECIFIC LIPID-TRANSFER 
PROTEIN PRECURSOR (NSL-TP): 
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35 % sur 106 AA ([318-417] ) avec la sequence 
SP:NLTP_BOVIN NONSPECIFIC LIPID-TRANSFER 
PROTEIN (STEROL CARRIER PROTEIN 2) (SCP-2). 
Length = 121 

5 et 30% sur 133 AA [294-417] avec la sequence 

SP:NLTP_RAT NONSPECIFIC LIPID-TRANSFER 
PROTEIN PRECURSOR (NSL-TP) (STEROL CARRIER 
PROTEIN 2) (SCP-2) (STEROL CARRIER PROTEIN X) 
(SCP-X) (SCPX).Length = 547 

10 

Fonction putative : 

L'ORF de 422 acides amines possede des homologies avec differentes 
prot6ines enzymatiques putatives impliqu6es dans les m6canismes de 
deshydrogenation des sterols de plusieurs organismes: homme, souris, 

15 E. coli, S. cerevisiae, C. elegans. De plus nous avons pu mettre en 
6vidence une homologie avec une sequence de la proline SCP-2 
impliquee dans le transport intracellulaire des lipides. De ce fait, le g6ne 
GS15231 code pour une prot§ine d'interet de par sa fonction possible 
dans le defaut de trafic intracellulaire du cholesterol chez les patients 

20 Tangier/FHD, ce qui renforce ttnteret de Tetude du gene GS15231. 

De plus le g6ne GS15231 est par sa localisation un g6ne candidat 
positionnel pour I'etude et la caracterisation du defaut genetique observe 
dans la maladie de Tangier ou le defaut familial en HDL. 

Les polypeptides de sequences SEQ ID N° 139 et 140 sont 

25 susceptibles d'intervenir dans la regulation du flux du cholesterol, et plus 
particulterement de la maladie de Tangier, dans des d6ficiences 
familiales en HDL, ou encore dans une maladie genetiquement liee au 
locus 9q31-34 du chromosome 9. 

30 
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Gene GS915528. 
Acide(s) nucleique(s) 

II a ete isoie selon Hnvention deux ARNs messagers 
correspondant a un transcrit du gene designe ici sous le n° GS915528. 
5 La premiere sequence nucleique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°25. 

La sequence SEQ ID N°25 a une longueur de 3106 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 1 au nucleotide en position 1272 
io de la sequence SEQ ID N°25. 

Aucune identite de sequence n'a 6te retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La deuxieme sequence nucleique de PADNC correspondant d ce 
transcrit constitue la sequence SEQ ID N° 26. 

is La sequence SEQ ID N° 26 a une longueur de 3313 nucleotides. 

Elle' comprend un cadre ouvert de lecture (ORF) partiel allant du 
nucleotide en position 3 au nucleotide en position 1370, qui correspond 
aussi a la sequence codante. Un signal de polyadenylation debute au 
nucleotide exposition 3280 de la sequence SEQ ID N° 26. 

20 Les homologies de sequence des la SEQ ID N° 26 ont ete 

observees avec des sequences referenc6es dans la base de donnees 
GenBank (Version 116) : 

- 99% d'identite nucleique sur 2755pb (position 119-2873) avec 
25 g7020444 AK000388 Homo sapiens cDNA FLJ20381 fis, done 

KAIA2329 Length = 2970 pb 

- 99% d'identite nucleique avec un BAG en cours de s6quen9age 
g6514007 AC013568 Homo sapiens clone RP11-1B9, WORKING 

30 DRAFT SEQUENCE 10 fragments non ordonn6s 
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Les analyses d'expression du transcrit de sequence SEQ ID N°25 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
demontrer que le gene GS915528 6tait exprim6 dans le cerveau foetal, 
5 le foie, la prostate, le cceur, le placenta, I'uterus, le testicule et le 
cerveau. 

De plus, une analyse de I'expression du transcrit par Northern 

blot, selon le protocole decrit de I'Exemple 1, a I'aide de la sonde de 

sequence SEQ ID N°92, a r6v6l6 la presence de transcrits dans le blot 
io commercialism par la Societe Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 

ID N°92 est respectivement de : 

- 1,9 kb, 3,2 kb et 3,8 kb dans le pancreas ; 

- 1 kb, 1 ,9 kb et 3,8 kb dans le coeur ; 
15 - 1 kb, 1 ,9 kb et 3,2 kb dans le foie ; 

- 1 kb et 1 ,9 kb dans le rein ; 

- 1 ,9 kb dans le muscle squelettique et le cerveau. 

Ce g6ne constitue un candidat positionnel causal d'une maladie due & 

un dysfonctionnement du flux inverse du cholesterol, et plus 
20 particulierement de la maladie de Tangier ou encore des deficiences 

familiales en HDL. 

Polypeptide cocte par Vacide nucleique de sequence SEQ ID NO 25 

25 Le cadre ouvert de lecture de la sequence d'acides nucleiques 

SEQ ID N°25 code potentiellement pour un polypeptide de 424 
aminoacides de longueur constituant la sequence SEQ ID N°141. 

Homologies observees au niveau de la sequence proteique : 

30 
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Cette ORF de 424 aa possede des homologies de type motif avec des 
domaines conserves de diff&rentes prolines tyrosine phosphatase dans 
differentes bases de donnees proteiques telles que : 

• 49% d'homologie sur 364 aa (position 3-366 aa) avec 
5 des sequences de SP-TrEMBL (SP-TrEMBL, version 7, 

novembre 1998): sp|P91433|P91433 code par I'ADNc 
YK65E9.3 de C. elegans et avec des sequences de 
Genpept: (traduction de Genbank v110 et 111, derniere 
remise a jour le 7 mai 1999): gi| 1708767) contenant un 
io domaine trouve dans la bande 4.1, ezrin, moesin, radixin 

et talin chez C. elegans 

• 44% d'homologie sur 322 aa (position 1-322 aa) sur des 
sequences de SP-TrEMBL (SP-TrEMBL, version 7, 

15 novembre 1998): sp|043491|043491 PROTEIN 4.1-G 

• 43% d'homologie sur 227 aa (position 7-233 aa) avec 
des sequences de PRODOM: (domaines homologues 
detectes dans Swissprot, version 34.2, novembre 1997): 

20 894 p34.2 (29) MOES(4) RADI(3) EZRI(3) correspondant 

au domaine proteine tyrosine phosphatase des proteines 
MOESIN BAND P81 VIUJN-2 EZRIN RADIXIN 
impliquees dans Torganisation membranaire. 

25 • 42% d'homologie sur 313 aa (position 9-321 aa) sur des 

sequences de Swissprot (version 36, derniere remise a 
jour du 3 mai 1999): sp|P29074|PTN4_HUMAN - 
proteine tyrosine phosphatase humaine MEG1 (EC 
3.1.3.48). 
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• 41% d'homologie sur 320 aa (position 7-326 aa) avec 
des sequences de PIR: (SEQUENCES PIR NON 
REDONDANTES, VERSION 57) non-redondante: PIR: 
(Sequences PIR non redondantes, version 57)|S|JU0188 
- proteine band 4.1 appartenant a la super-famille des 
proteines tyrosine phosphatase de souris. et des 
sequences de Swissprot (version 36, derniere remise & 
jour du 3 mai 1999): sp|P52963|NBL4_mouse - proteine 
NBL4 et des sequences de SP-TrEMBL (SP-TrEMBL, 
version 7, novembre 1998): sp|057457| proteine 
similaire a la proteine band 4. let des sequences de 
Genpept: (traduction de Genbank v110 et 111, derniere 
remise & jour le 7 mai 1999): gi|466548| - prot6ine NBL4 
de mus musculus 

# 41% d'homologie sur 314 aa (position 9-322 aa) sur des 
sequences de Swissprot (version 36, derniere remise a 
jour du 3 mai 1999) : sp|P11171|41_HUMANPROT£/A/ 
4.1 (BAND 4.1) (P4.1) 

Polypeptide code par I'acide nucleique de sequence SEQ ID N° 26 

Le cadre ouvert de lecture de la sequence d'acide nucteique SEQ 
ID N° 26 code potentiellement pour un polypeptide de 455 acides 
amines de longueur constituant la sequence SEQ ID N° 142. 

Homologies observ6es au niveau de la sequence prot6ique : 
Cette ORF de 455 aa possede des homologies de type motif avec des 
domaines conserves de differentes proteines tyrosine phosphatase dans 
differentes bases de donnees prot£iques telle que . 
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50% d'homologie sur 374 aa (position 24-397 aa) avec 
SP-trEMBL: sp|P91433|P91433 CODED FOR BY C. 
ELEGANS CDNA YK65E9.3 et avec Genpept115: 
gi|1708767| U80955 contenant un domaine trouve dans 
la bande 4.1, ezrin t moesin, radixin et talin chez c. 
elegans 

45% d'homologie sur 333 aa (position 21-353 aa) sur 
SP-trEMBL: sp|043491|043491 PROTEIN 4.1-G. 

43% d'homologie sur 227 aa (position 7-233 aa) avec 
Prodom: 894 p34.2 (29) MOES(4) RADI(3) EZRI(3) 
correspondant a la PROTEIN PHOSPHATASE 
PROTEIN-TYROSINE MOESIN BAND P81 ViLLIN-2 
EZRIN RADIXIN MEMBRANE-ORGANIZING 

42% d'homologie sur 329 aa* (position 24-352 aa) sur 
Swissprot38: sp|P29074|PTN4JHUMAN PROTEIN- 
TYROSINE PHOSPHATASE MEG1 (EC 3.1.3.48) 
(PTPASE-MEG1) (MEG). 

42% d'homologie sur 335 aa (position 23-357aa) avec 
PIR non-redondante: pir|S|JU0188 band 4.1 protein 
tyrosine-phosphatase superfamily member protein de 
souris et Swissprot: sp|P52963|NBL4_mouse NBL4 
protein et SP-trEMBL: sp|057457| band 4.1-like protein 
4 et Genpept: gi|466548| NBL4 mus musculus protein 
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• 41% d'homologie sur 332 aa (position 22-353 aa) sur 
Swissprot : sp|P11171|41 JHUMAN PROTEIN 4.1 (BAND 
4.1)(P4.1). 

5 Fonction putative : 

Le gene GS915528 presente un interet pour I' ietude fonctionnelle de la 
maladie de Tangier et du FHD en ce sens qu'il s'agit a la fois d'un 
candidat positionnel et d'un gene codant pour une nouvelle proteine dont 
les fonctions putatives (tyrosine phosphatase) pourraient jouer un role 

io dans la cascade de signalisation intracellular Ii6e a I'efflux du 
cholesterol intracellulaire m6di6 par les particules HDL, impliqu6 dans la 
maladie de Tangier et la deficience familiale en HDL (FHD). 

Les polypeptides de sequences SEQ ID N° 141 et 142 sont 
susceptibles d'intervenir dans la regulation du flux du cholesterol, et plus 

15 particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie ggnetiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

20 Gene GS99817 

Acide(s) nucleique(s) 

II a ete isole selon I'invention deux ARNs messagers 
correspondant a un transcrit du gene designe ici sous le n° GS99817. 

La premiere sequence nucleique de I'ADNc correspondant d ce 
25 transcrit constitue la sequence SEQ ID N°27. 

La sequence SEQ ID N°27 a une longueur de 1539 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 3 au nucleotide en position 698 de 
la sequence SEQ ID N°27. 
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Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donn6es GenBank (Version 110). 

La seconde sequence nucleique de I'ADNc correspondant S ce 
transcrit constitute la sequence SEQ ID N° 28. 
5 La sequence SEQ ID N° 28 a une longueur de 3404 nucleotides. 

Elle comprend un cadre ouvert de lecture (ORF) partiel allant du 
nucleotide en position 1 au nucleotide en position 792 de la sequence 
SEQ ID N° 28. 

Des homologies de sequence de la SEQ ID NT 28 ont ete 
io retrouvees avec des sequences r6f6renc6es dans la base de donn6es 
GenBank (Version 116) : 

- Identite de 97% sur 380 pb avec un BAC END CIT-HSP-2166G6.TR 
CIT-HSP Homo sapiens genomic clone 2166G6, genomic survey 
sequence Length = 380gi|2975337|gb|B93000.1|B93000[2975337] 

15 

- Identite de 100% sur 315 pb avec un BAC END HS_2166_A2_D03_MR 
CIT Approved Human Genomic Sperm Library D Homo sapiens genomic 
clone Plate=2166 Col=6 Row=G, genomic survey sequence Length = 
316gi|3480271|gb|AQ104915.1|AQ104915[3480271] 

20 

Les analyses d'expression du transcrit de sequence SEQ ID N°27 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectu6es a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS99817 6tait exprim6 dans le cerveau foetal. 

25 De plus, une analyse de I'expression du transcrit par Northern 

blot, selon le protocole decrit de I'Exemple 1, a I'aide de la sonde de 
sequence SEQ ID N°93 t a revele la presence de transcrits dans le blot 
commercialise par la Society Clontech (Ref. N° 7759-1). 

La taille des transcrits detectes avec la sonde de sequence SEQ 

30 ID N°93 est respectivement de : 
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- 1,5 kb, 2 kb et 4,4 kb dans le coeur et le cerveau ; 

- .2 kb et 4,4 kb dans le pancreas ; 

- 1,5 kb at 4,4 kb dans le rein et le muscle suqelettique. 

5 Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie g§n6tiquement Itee au locus 
9q31-34 du chromosome 9. 

10 

Polypeptide code parl'acide nucleique de sequence SEQ ID NO 27 

Le cadre ouvert de lecture de la sequence d'acide nucleique SEQ 
ID N°27 code potentiellement pour un polypeptide de 232 aminoacides 
de longueur constituant la s6quence SEQ ID N°143. 

15 Homologies observees au niveau de la sequence proteique : 

27% d'homologie sur 211 aa (position 11-221 aa) avec des sequences 
deGenpept: (traduction de Genbank v110 et 111, derntere remise a jour 
le 7 mai 1999): gi|3876730| et des sequences de TrEMBL (SP-TrEMBL, 
version 7, novembre 1998): sp|Q20021| correspondant £ la traduction de 

20 la sequence d'un cosmide de nematode F35C11.4 (Caenorhabditis 
elegans). 

Polypeptide code par Vacide nucleique de sequence SEQ ID N° 28 

Le cadre ouvert de lecture de la sequence d'acide nucI6ique SEQ 
25 ID N° 28 code potentiellement pour un polypeptide de 263 acides 
amines de longueur constituant la sequence SEQ ID N° 144. 
II a ete observe des homologies entre la sequence SEQ ID N° 144 et les 
sequences suivantes : 

Homologies observees au niveau de la sequence proteique: 
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28% d'homologie sur 255 aa (position 1-255 aa) avec Genpept: 
gi|3876730| et trEMBL: sp|Q20021| correspondant a la traduction 
de la sequence d'un cosmide de nematode F35C11,4 
(Caenorhabditis elegans). 

5 

Fonction putative : 

Ce gene est un candidal pour I'etude de la maladie de Tangier/FHD du 
fait de la localisation chromosomique, 

Les polypeptides de sequences SEQ ID N° 143 et 144 sont 
10 susceptibles d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie genetiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

15 

Gene GS916229. 
Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designe ici sous le n° GS916229. 
20 La sequence nucleique de FADNc correspondant £ ce transcrit 

constitue la sequence SEQ ID N°29. 

La sequence SEQ ID N°29 a une longueur de 792 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) allant 
du nucleotide en position 1 au nucleotide en position 203 de la sequence 
25 SEQ ID N°29. 

Aucune identite de sequence n'a 6te retrouv6e lors d'une 
recherche dans la base de donn6es GenBank (Version 110). 

Les analyses d'expression du transcrit de sequence SEQ ID N°29 
30 ont ete realisees par RT PCR, cpmme decrit dans I'Exemple 1. Ces 



WO 00/71710 



56 



PCT/FR00/01426 



analyses effectives & partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS9 16229 etait exprime dans le cerveau foetal, 
le foie. le cerveau, le cceur, la prostate, le placenta, le foie foetal, I'uteru.s, 
le testicule et le rein. 

5 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore & une maladie g6n6tiquement Ii6e au locus 
10 9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 29 

Le cadre ouvert de lecture de la s6quence d'acides nucteiques 
SEQ ID N°29 code potentiellement pour un polypeptide de 68 
is aminoacides de longueur constituant la sequence SEQ ID N°145. 

Aucune homologie significative avec BLAST n'a et6 retrouv6e 
avec les sequences references dans les bases de donn6es Swissprot 
(version 36, derniere remise a jour du 3 mai 1999) et PRODOM: 
(domaines homologues detectes dans Swissprot, version 34.2, 
20 novembre 1997). 

Le polypeptide de sequence SEQ ID N° 146 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des d6ficiences 
25 familiales en HDL, ou encore dans une maladie g6n6tiquement liee au 
locus 9q31-34 du chromosome 9. 
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Acide(s) nucleique(s) 
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II a 6t6 isole selon Finvention trois ARN messagers correspondant 
respectivement a un transcrit long et deux transcrits courts du g6ne 
designe ici sous le n° GS92544. 

La sequence nucleique de TADNc correspondant au transcrit long 
5 constitue la sequence SEQ ID N°30. 

La sequence SEQ ID N°30 a une longueur de 2733 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 1 au nucleotide en position 2160 
de la sequence SEQ ID N°30. 

10 

La premiere sequence nucleique de I'ADNc correspondant au 
transcrit court constitue la sequence SEQ ID N°31. 

La sequence SEQ ID N°31 a une longueur de 2694 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
is partiel allant du nucleotide en position 1 au nucleotide en position 2121 
de la sequence SEQ ID N°31. 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La seconde sequence nucteique de I'ADNc correspondant au 
20 second transcrit court constitue la sequence SEQ ID N° 32. 

La sequence SEQ ID N° 32 a une longueur de 2765 nucleotides. 
Elle comprend un cadre ouvert de lecture complet allant du nucleotide 
en position 56 au nucleotide en position 2287 de la sequence SEQ ID N° 
32. La sequence codante debute au nucleotide en position 410 et se 
25 termine au nucleotide en position 2160 de la sequence SEQ ID N° 32.. 
Le codon d'initiation de la traduction debute sur le nucleotide en position 
410 de la sequence SEQ ID N° 32. 

La sequence SEQ ID N° 32 possede des homologies avqc les 
sequences referencees dans la base de donnees GenBank (Version 
30 116) suivantes : 
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• 100% d'homologie sur 2419 pdb (positions [485-2903] ) matchant 
avec les positions [ 1-2419] cle la sequence g6807990 (AL137432 ) 
Homo sapiens mRNA; cDNA DKFZp761E1824 (from clone 
DKFZp761E1824); partial cds , length=2438 pdb f deposee le 18- 

5 FEB-2000, sur Chromosome 9, et annotee " similaire au CR2 
receptor " 

• 97 % d'homologie sur 157 pdb (positions [1271-1427] )avec les 
positions [431-277] de g3590696 (AQ1 92074) 

io HS_3228_B2_H1 1 J7 CIT Approved Human Genomic Sperm Library 
D Homo sapiens genomic clone Plate=3228 Col=22 Row=P, genomic 
survey sequence. Length = 513 

• Plusieurs fragments de 99% a 100% d'identite avec la sequence 
is gi|6982613| |AL138756 : Homo sapiens chromosome 9 clone RP11- 

401 map q31.3-33.1. *** SEQUENCING IN PROGRESS 41 
unordered pieces 

• Plusieurs fragments de 100% d'identite avec la sequence g7230026 
20 (AC010824) Homo sapiens clone RP11-5A23, *** SEQUENCING IN 

PROGRESS 32 unordered pieces. Length = 162010 

Les analyses d'expression du transcrit long et du transcrit court 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
25 analyses effectu6es a partir d'ARN polyA+de difterents tissus ont permis 
de montrer que le gene GS92544 etait exprimS dans le cerveau foetal. 

De plus, une analyse de I'expression de ces transcrits par 
Northern blot, a I'aide respectivement des sondes de sequence SEQ ID 
N°94, a r6v6l6 la presence de transcrits dans le blot commercialise par la 
30 Society Clontech (Ref. N° 7759-1). 
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La taille des transcrits detectes avec la sonde de s6quence SEQ 
ID N°94 est respectivement de 4 kb et de 6 kb dans le placenta. 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
5 un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie g6netiquement li£e au locus 
9q31-34 du chromosome 9. 

io Polypeptides codes par les acides nucleiques de sequences SEQ ID. 
NO 30 et31 

Le cadre ouvert de lecture de la sequence d'acides nucleiques 
SEQ ID N°30 (transcrit long) code potentiellement pour un polypeptide 
de 720 aminoacides de longueur constituant la sequence SEQ ID N°146. 
15 Le cadre ouvert de lecture de la sequence d'acides nucleiques 

SEQ ID N°31 (transcrit court) code potentiellement pour un polypeptide 
de 707 aminoacides de longueur constituant la sequence SEQ ID N°147. 

Homologies observees au niveau de la sequence proteique: 
Cette sequence possede des homologies significatives des positions 
20 1 39-194 aa / 199 - 254 aa avec des domaines conserves sushi. HMM de 
la base de donnees Pfam (HMMER 2.0 (June 1998). 

Cette ORF possede une annotation dans Genpept: (traduction de 
Genbank v110 et 111, derniere remise £ jour le 7 mai 1999) et TrEMBL 
25 (SP-TrEMBL, version 7, novembre 1998) avec la traduction BlastX de 
nombreuses sequences telles que : 

• 42% d'homologie sur 115 aa (position 2-116 aa) avec 
des sequences de gi|340164| pr6curseur humain de 
I'uromoduline et gi|340166| uromoduline [Homo sapiens] 
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sur Genpept: (traduction de Genbank v110 et 111, 
derniere remise a jour le 7 mai 1999) 

• 37% d'homologie sur 141 a (position 2-142 aa) avec des 
5 sequences de SP-TrEMBL (SP-TrEMBL, version 7, 

novembre 1998): sp]P87363|P87363 un frament de ia 
FIBRILLINE-1. 

• 30% d'homologie sur 234 aa (position 7-240 aa) avec 
10 des sequences de Genpept: (traduction de Genbank 

v110 et 111, derniere remise a jour le 7 mai 1999): 
gi|306746| et gi|1335064| fibrilline humaine. 

• 30% d'homologie sur 194 aa (position 8-201 aa) avec 
is des sequences de SP-TrEMBL (SP-TrEMBL, version 7, 

novembre 1998): sp|O35806|O35806 LATENT TGF- 
BE7* BINDING PROTEIN-2 LIKE PROTEIN 

Polypeptide code par I'acide nucleique de sequence SEQ ID N° 32 
20 Le cadre ouvert de lecture de la sequence d'acide nucteique SEQ 

ID N° 32 code potentiellement pour un polypeptide de 713 acides 

amines de longueur constituant la sequence SEQ ID N° 148. 

Des homologies de la sequence SEQ ID N° 148 ont §t§ 

observees avec des sequences references dans des bases de 
25 donn6es. Les homologies sont les suivantes : 

• homologie avec Genpept: gi|340164| uromodulin 
precursor [Homo sapiens] et Genpept: gi|340166| 
uromodulin [Homo sapiens] 

• homologie avec SP-trEMBL: sp|P87363|P87363 
30 FIBRILLIN-1 (FRAGMENT). 
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• homologie avec Genpept: gi|306746| et gi|1335064| 
fibrillin (Homo sapiens] 

• homologie avec SP-trEMBL: sp|O35806|O35806 
LATENT TGF-BETA BINDING PROTEIN-2 LIKE 

5 PROTEIN 

• homologie avec g784994 (X81479) EMR1 [Homo 
sapiens] Length = 886 

• homologie avec g4379069 (X94630) seven-span 
transmembrane protein [Homo sapiens] 

io • Autres homologies avec des proteines telles que: 

EMR1, CD97, fibulins, complement receptor... 



La sequence SEQ ID N° 148 possede des motifs caracteristiques tels 
que 3 domaines EGF dont 2 calcium binding, un site de tyrosine 
1 5 phosphatase, un domaine hydrophobe en N-terminal ; Nombreux sites 
de glycosylation ; 2 camp sites de phosphorylation ; 2sites Asp * 
hydroxylation. 



Fonction putative : 

20 De par son homologie avec I'uromoduline, le produit du gene 

GS92544 est putativement une proteine associee a la membrane 
comme I'uromoduline qui est une proteine ancr6e au moyen d'un 
glycosylphosphatidylinositol (GPI). Ces r£sultats bas6s sur les Etudes 
d'homologie de sequence partielles en acides amines sugg6rent que le 

25 produit du g6ne GS92544 pourrait etre associ§ £ la membrane par une 
liaison aux lipides membranaires et done pourrait etre assocte au deficit 
d f efflux du cholesterol cellulaire observe chez les patients FHD ou 
Tangier. 

Les polypeptides de sequences SEQ ID N° 146, 147 et 148 sont 
30. susceptibles d'intervenir dans la regulation du flux du cholesterol, et plus 
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particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie genetiquement liee au 
• locus 9q31 -34 du chromosome 9. 

5 Gene GS930824 

Acide(s) nucleique(s) 

II a ete isole selon I'invention deux ARNs messagers 
correspondent a un transcrit du gene designe ici sous le n° GS930824. 
La premiere sequence nucleique de I'ADNc correspondent a ce 
io transcrit constitue la s6quence SEQ ID N°33. 

La sequence SEQ ID N°33 a une longueur de 4745 nucleotides. 
Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 2 au nucleotide en position 514 de 
la sequence SEQ ID N°33. 
15 Homologies observees au niveau de la sequence nucleotidique: 

90% d'homologie avec Genbank :AF1 15435, syntaxine 17 de rat sur 510 
pb (position 22-531 pb). 

La seconde sequence nucleique de I'ADNc correspondant d ce 
transcrit constitue la sequence SEQ ID N° 34 . 

20 La sequence SEQ ID N° 34 a une longueur de 5241 nucleotides. 

Elle comprend un cadre ouvert de lecture (ORF) complet allant du 
nucleotide en position 57 au nucleotide en position 1013 de la sequence 
SEQ ID N°34. La sequence codante debute au nucleotide en position 
105 et se termine au nucleotide en position 1013 de la sequence SEQ ID 

25 N° 34. Le codon d'initiation de la traduction debute sur le nucleotide en 
position 105 de la sequence SEQ ID N°34. 

La sequence SEQ ID NT 34 possede des homologies avec des 
sequences referencees dans la base de donnees GenBank (Version 
116). II s'agit des homologies suivantes : 

30 

• 90% d'homologie avec Genbank :AF1 15435, syntaxine 17 de rat sur 
510 pb (position 22-531 pb). 
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• 92 % d'homologie sur 475 pdb (positions [540-1036] ) et 84% sur 
406 pdb (positions [102-507]) avec la sequence g4206160 .( 
AF1 15435 ) Rattus norvegicus syntaxin 17 mRNA, complete 

5 cds.Length = 1678; 

• 98% d'homologie sur 431 pdb (positions [1899-2329]) et 91% sur 62 
pdb ( positions [1819-1880]) avec la sequence g4652677 
(AQ474416) CITBI-E1-2588I9.TF CITBI-E1 Homo sapiens genomic 

io clone 2588I9, genomic survey sequence. Length « 525; 

• 99% d'homologie sur 331 pdb ( positions [6394-6724]) avec la 
sequence g2929043 ( B87911) RPCI11-30N20.TP RPCI-11 Homo 
sapiens genomic clone RPCI-11-30N20, genomic survey 

15 sequence. Length = 425; 

• 99% d'homologie sur 2662 pdb ( positions [20-2681] ) avec la 
sequence g7020892 ( AK000658) Homo sapiens cDNA FLJ20651 
fis, clone KAT01814.Length = 2678; Submitted (15-FEB-2000) to the 

20 DDBJ/EMBL/GenBank databases, projet NEDO. 

Les analyses d'expression du transcrit de sequence SEQ ID N°33 
ont ete realisees par RT PCR, comme d6crit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
25 de montrer que le gene GS930824 etait exprim§ dans le cerveau foetal, 
le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal, I'uterus, 
le testicule, le rein et le muscle squelettique. 

De plus, une analyse de 1'expression du transcrit par Northern 
blot, selon le protocole d6crit de I'Exemple 1, a I'aide respectivement des 
30 sondes de sequence SEQ ID N° 95 et 96, a revele la presence de 
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transcrits dans le blot commercialise par la Society Clontech (Ref. N° 
7759-1). 

La taille des transcrits d&ectes avec la sonde de sequence SEQ 
ID N°95 est respectivement de : 
5 -1,1 kb, 1,6 kb, 2,6 kb, 4,9 kb.et 7 kb dans le pancreas, le rein, le 
muscle squelettique, le foie, le cerveau et le cceur ; 
- 1,6 kb, 2,6 kb, 4,9 kb.et 7 kb dans le poumon et le placenta. 

La taille des transcrits d6tectes avec la sonde de s6quence SEQ 
io ID N°96 est respectivement de : 

- 1,35 kb, 2,4 kb, 3,5 kb et 10 kb dans le placenta ; 
- 1 ,35 kb et 2,4 kb dans le pancreas, le rein et le foie ; 
- 1 ,35 kb dans le poumon ; 

- 2,4 kb dans le muscle squelettique, le cerveau et le coeur. 

is 

Ce gene constitue un candidat positionnel causal d'une maladie due & 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulterement de la maladie de Tangier ou encore des deficiences 
familiales en HDL. 

20 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 33 

Le cadre ouvert de lecture de la sequence d'acides nucleiques 
SEQ ID N°33 code potentiellement pour un polypeptide de 170 
aminoacides de longueur constituant la sequence SEQ ID N°149. 
25 Aucune homologie significative avec BLAST n'a 6t6 retrouv6e 

avec les sequences referenc6es dans les bases de donn6es Swissprot 
(version 36, derniere remise a jour du 3 mai 1999) et PRODOM: 
(domaines homologues detectes .dans Swissprot, version 34.2, 
novembre 1997). 

30 Homologies observees au niveau de la sequence proteique: 
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72% d'homologie avec des sequences de Genpept: (traduction de 
Genbank v110 et 111, derniere remise a jour le 7 mai 1999) :gi4206161 
sur 170 acides amines (position 1-170 aa) gi4206161 est la traduction 
prot6ique du gene codant pour la syntaxine 17 de rat. Genpept: 
5 (traduction de Genbank v110 et 111, derniere remise a jour le 7 mai 
1999): 

Polypeptide code par I'acide nucleique de sequence SEQ ID N° 34 
Le cadre ouvert de lecture de la sequence SEQ ID N° 34 code 
io potentiellement pour un polypeptide de 318 acides amines constituant la 
sequence SEQ ID N° 150. 

Les homogies suivantes ont 6te observ6es : 

- 72% d'homologie avec Genpept :gi4206161 sur 170 acides amines 
is (position 1-170 aa). Genpept :gi4206161 est la traduction proteique du 

gene codant pour la syntaxine 17 de rat. 

Homologie proteique sur Genpeptl 15, Trembl et PIR : 

- 75% d'homologie sur 302 AA ( positions (105-1010] ) avec toute la 
20 longeur la sequence traduite g4206161 (AF1 15435) syntaxin 17 

[Rattus norvegicus]Length = 301; de la g4206161 

Le polypeptide de sequence SEQ ID N° 150 possede un motif 
caracteristique d'une syntaxine entre les nucleotides, en positions 1 et 
25 243 du cadre de lecture ouvert. 

Fonction putative : 

Les polypeptides de sequence SEQ ID N°149 et 150 
s'apparentent done & une proline de la famille des syntaxines impliquee 
30 dans le transport vesiculate intracellular. Ce m6canisme sous-tendu 
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par un adressage sp6cifique m6di6 par ces proteines est d'interet par 
rapport a la maladie de Tangier/FHD qui est decrite par un d6faut du 
mecanisme de transport et de translocation des pools de cholesterol 
intracellular vers les particules HDL accepteurs. Les polypeptides de 
5 sequence SEQ ID N°149 et 150 sont done susceptibles d'intervenir dans 
une etape importante impliquee dans le transport inverse du cholesterol 
par les HDL. 

Les polypeptides de sequences SEQ ID N° 149 et 150 sont 
egalement susceptibles d'intervenir dans une maladie genetiquement 
to liee au locus 9q31-34 du chromosome 9. 

Gene GS93382. 
Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
15 un transcrit du gene designe ici sous le n° GS93382. 

La sequence nucleique de I'ADNc correspondant a ce transcrit 
constitue la sequence SEQ ID N°35. 

La sequence SEQ ID N°35 a une longueur de 3014 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
20 partiel allant du nucleotide en position 3 au nucleotide en position 371 de 
la sequence SEQ ID N°35. 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donn6es GenBank (Version 110). 

25 Les analyses d'expression du transcrit de sequence SEQ ID N°35 

ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de diff6rents tissus ont permis 
de montrer que le gene GS93382 etait exprime dans le cerveau foetal. 
De plus, une analyse de ['expression du transcrit par Northern 

so blot, selon le protocole d6crit de I'Exemple 1, a I'aide de la sonde de 
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sequence SEQ ID N°97, a r6v6l6 la presence de transcrits dans le blot 
commercialise par la Soci6t6 Clontech (Ref. N° 7759-1). 

La taille des transcrits d6tectes avec la sonde de sequence SEQ 
ID N°97 est respectivement de : 
5 - 2 kb et 7,5 kb dans le cerveau ; 

- 2 kb dans le pancreas, le rein, le muscle squelettique, le foie et le 
cceur. 

Ce gene constitue un candidat positionnel causal d'une maladie 
io due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

1 5 Polypeptide code par I'acide nucleique de sequence SEQ ID NO 35 
Le cadre ouvert de lecture de la sequence d'acides nucleiques 
SEQ ID N°35 code potentiellement pour un polypeptide de 123 
aminoacides de longueur constituant la sequence SEQ ID N°151. 

Aucune homologie significative avec BLAST n'a et6 retrouv6e 

20 avec les sequences references dans les bases de donnees Swissprot 
(version 36, derniere remise a jour du 3 mai 1999), PRODOM: 
(domaines homologues detectes dans Swissprot, version 34.2, 
novembre 1997),Genpept: (traduction de Genbank v1 10 et 111, derniere 
remise a jour le 7 mai 1999), Swissprot (version 36, derniere remise a 

25 jour du 3 mai 1999), TrEMBL (SP-TrEMBL, version 7, novembre 1998), 
PIR; (SEQUENCES PIR NON REDONDANTES, VERSION 57) et PDB: 
(PROTEIN DATA BANK, FEVRIER 1999). 

Le polypeptide de sequence SEQ ID N° 151 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 

30 particulierement de la maladie de Tangier, dans des deficiences 
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familiales en HDL, ou encore dans une maladie genetiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

5 Gene GS946300. 

Acide(s) nucleique(s) 

II a ete isole selon invention un ARN messager correspondant d 
un transcrit du gene designe ici sous le n° GS946300. 

La sequence nucleique de I'ADNc correspondant a ce transcrit 
io constitue la sequence SEQ ID N°36. 

La sequence SEQ ID N°36 a une longueur de 1575 nucleotides. 
Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 3 au nucleotide en position 176 de 
la sequence SEQ ID N°36. 
is Aucune identite de s6quence n'a 6t6 retrouv6e lors d'une 

recherche dans la base de donnees GenBank (Version 110). 

Les analyses d'expression du transcrit de sequence SEQ ID N°36 
ont 6t6 r6alis6es par RT PCR, comme decrit dans I'Exemple 1. Ces 
20 analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS946300 6tait exprim6 dans le cerveau foetal, 
le foie, le cerveau. le cceur, la prostate, le placenta, le foie foetal, TutSrus, 
le testicule et le rein. 

25 Ce gene constitue un candidat positionnel causal d'une maladie due d 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

30 
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Polypeptide code par I'acide nucleique de sequence SEQ ID NO 36 

Le cadre ouvert de lecture de la sequence d'acides nucteiques 
SEQ ID N°36 code potentiellement pour un polypeptide de 58 
aminoacides de longueur constituant la sequence SEQ ID N°152. 

Aucune homologie significative avec BLAST n'a ete retrouvee 
avec les sequences references dans les bases de donn6es Swissprot 
(version 36, derniere remise £ jour du 3 mai 1999) et PRODOM: 
(domaines homologues d&ectes dans Swissprot version 34.2, 
novembre 1997). 

io Le polypeptide de sequence SEQ ID N°152 est susceptible 

d'intervenir dans la regulation du flux de cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL. 

Le polypeptide de sequence SEQ ID N°152 est done susceptible 

15 d'intervenir dans une etape importante impliquee dans le transport 
inverse du cholesterol par les HDL. 

Gene GS937345. 
20 Acide(s) nucleique(s) 

II a 6t§ iso!6 selon I'invention deux ARN messagers correspondant 
respectivement a un transcrit long et un transcrit court du gene design^ 
ici sous le n° GS937345. 

Une premiere sequence nucleique de TADNc correspondant au 
25 transcrit long a 6te isolee et constitue la s6quence SEQ ID N°37. 

La sequence SEQ ID N°37 a une longueur de 1607 nucleotides. 

Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 2 au nucleotide en position 109 de 
la sequence SEQ ID N°37. 
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A partir de la sequence SEQ ID N° 37, deux amorces de 
sequences respectives SEQ ID N° 104 et 105 ont ete synthetis^es et ont 
permis d'amplifier un ADNc a partir d'une banque d'ARNm polyA+ de 
differents tissus humains commercialis6e par la society Clontech. 

5 La sequence d'ADNc amplifiee a I'aide des amorces de sequence 

SEQ ID NT 104 et 105 constitue la sequence SEQ ID N° 38. La 
sequence SEQ ID N° 38 a une longueur de 1161 nucleotides. 

Des homologies ont ete retrouvees entre la s6quence SEQ ID N° 
38 et des sequences referencees dans la base de donnees GenBank 

io (Version 116). Les homologies sont les suivantes : 

• 99% d'homologie sur 1096 pdb (positions [1-1093]) matchant avec 
les positions [8-1102] de la sequence 

gi|6841231|gb|AF161409.1|AF161409[684123T]Homo sapiens 
15 HSPC291 mRNA, partial cds. Length = 1 102; 
unpublished ; 

• 99% sur 1025 pdb (positions [119-1148]) matchant avec les 
positions [8-1030] de la sequence 

20 gi|6841235|gb|AF161411.1|AF16141 1[6841235] Homo sapiens 
HSPC293 mRNA, partial cds. Length = 1045; unpublished ; 



• 99% sur 1161 pdb (positions [1-1161] ) matchant avec les positiosn 
25 [43-1202] de la sequence 

gi|7020861|dbj|AK000637.1|AK000637[7020861] Homo sapiens 
cDNA FLJ20630 fis, clone KAT03874. Length = 1538; deposee le 22- 
FEB-2000, projet NEDO ; unpublished ■ 
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♦ 92 % sur 1003 pdb (positions [1-1043]) et 94% sur 38 pdb (positions 
[1048-1085]) avec la sequence 

gb|AC021286.2|AC021286[6899766] Homo sapiens clone RP11- 
21H22, WORKING DRAFT SEQUENCE, 19 unordered pieces. 
5 Length = 175143; 

La sequence nucleique de I'ADNc correspondant au transcrit court 
constitue la sequence SEQ ID N°39. 

La sequence SEQ ID N°39 a une longueur de 1332 nucleotides. 

10 

Aucune identite de sequence n'a ete retrouvee pour les 
sequences respectives du transcrit long et du transcrit court lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

15 Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

20 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 37 

Le cadre ouvert de lecture partiel du transcrit long de sequence 
d'acides nucl6iques SEQ ID N°37 code potentiellement pour un 
polypeptide de 36 aminoacides de longueur constituant la sequence 
25 SEQ ID N°153. 

Homologies observees au niveau de la sequence nucl6otidique: 
41% d'identite sur 22 aa (position 6 a 29 aa) avec des sequences de 
Swissprot (version 36, derntere remise a jour du 3 mai 1999): sp|P23596| 
PRTD JERWCH Proteases secretion ATP- Binding protein PRTD. 

30 
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Ce gene est un candidat pour I'etude de la maiadie de Tangier/FHD du 
fait de la localisation chromosomique. 

Gene GS99556 
5 Acide(s) nucleique(s) 

II a ete isole selon ['invention deux ARN messagers correspondant 
respectivement a un transcrit long et £ un transcrit court du g6ne d6sign6 
ici sous le n° GS99556. 

La sequence nucleique de I'ADNc correspondant au transcrit long 
10 constitue la sequence SEQ ID N°40. 

La sequence SEQ ID N°40 a une longueur de 10419 nucl6otides. 
Cette sequence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 2 au nucleotide en position 1954 
de la sequence SEQ ID N°40. 
15 Le codon d'initiation (ATG) debute au nucleotide en position 29 du 

transcrit long de sequence SEQ ID N°40. 

La sequence nucleique de I'ADNc correspondant au transcrit court 
constitue la sequence SEQ ID N 6 41. 
20 La sequence SEQ ID N p 41 a une longueur de 1813 nucleotides. 

Aucune identite de sequence n'a 6t6 retrouvSe lors d'une 
recherche dans la base de donnees'GenBank (Version 110). 

25 

Les analyses d'expression du transcrit de sequence SEQ ID N°40 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectu6es a partir d'ARN polyA+de differents tissus ont permis 
de montrer que le gene GS99556 etait exprime dans le cerveau foetal, le 
30 foie, le cerveau, le coeur, la prostate, le placenta et le foie foetal. 
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De plus, une analyse de 1'expression du transcrit par Northern 
blot, selon le protocole decrit de I'Exemple 1, d I'aide respectivement des 
sondes de sequence SEQ ID N°98 et SEQ ID N°99, a r6v6l6 la presence 
de transcrits dans le blot commercialism par la Soci6t6 Clontech (Ref. N° 
5 7759-1). 

La taille des transcrits detects avec la sonde de sequence SEQ 
ID N°98 est respectivement de : 

- 2,6 kb , 4,2 kb, 5 kb et 10 kb dans le cerveau ; 

- 2,6 kb et 5 kb dans le foie, le poumon,. le placenta et le coeur ; 
10 - 2,6 kb et 5 kb dans le rein ; 

- 2,6 kb dans le muscle squelettique ; 

- 5 kb dans le pancreas. 

La taille des transcrits d£tect£s avec la sonde de sequence SEQ 
15 ID N°99 est respectivement de : 

- 2,2 kb dans le foie ; 

- 2,4 kb et 4,4 kb dans le coeur ; 

- 9 kb dans le cerveau, le placenta, le rein, le pancreas et le poumon. 

20 La taille des transcrits d6tect6s avec la sonde de sequence SEQ 

ID N° 100 est respectivement de : 

- 5 kb et 7 kb dans le placenta et le coeur ; 

- 5 kb dans le cerveau, le rein et le pancreas. 

25 Ce gene constitue un candidat positionnel causal d'une maladie 

due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

30 
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Polypeptide code par I'acide nucleique de sequence SEQ ID NO 40 

Le cadre ouvert de lecture partiel de la sequence d'acides 
nucleiques SEQ ID N°40 code potentiellement pour un polypeptide de 
5 651 aminoacides de longueur constituant la sequence SEQ ID N°154. 
Homologies observ6es au niveau de la sequence proteique : 
Cette ORF possede des homologies avec des sequences de Genpept: 
(traduction de Genbank v110 et 111. derni§re remise a jour le 7 mai 
1999) et de TrEMBL (SP-TrEMBL, version 7, novembre 1998) 
io (traduction BlastX des sequences suivantes) : 

• 32% d'homologie sur 403 aa dansGenpept: 
(traduction de Genbank v110 et 111, derntere 
remise a jour le 7 mai 1999) avec gi|4529890| 

is NG22 [Homo sapiens] 

• 25% d'homologie sur 693 aa dans Genpept: 
(traduction de Genbank v110 et 111, derniere 
remise a jour le 7 mai 1999) avec gi|3986770| 

20 NG22 [Mus musculus] 

24% d'homologie sur 683 aa dansGenpept: (traduction de Genbank 
v110 et 111, derniere remise a jour le 7 mai 1999) avec gi|1072187| 
correspondant £ I'ADNc CEESB82F de C elegans 

25 

• 24% d'homologie sur 683 aa avec TrEMBL (SP- 
TrEMBL, version 7, novembre 1998) sp|Q20026| 
code par I'ADNc CEESB82F de C elegans 

30 Fonction putative : 
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Ce gene est un candidat pour l'6tude de la maladie de Tangier/FHD du 
fait de la localisation chromosomique, 

Le polypeptide de sequence SEQ ID N° 154 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
5 particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie genetiquement liee au 
locus 9q31-34 du chromosome 9. 

10 Gene GS96663. 

Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designe ici sous le n° GS96663. Six sequences 
nucleiques representatives de ce transcrit ont et6 determinees : 
15 La premiere sequence nucleique partielle de I'ADNc 

correspondant a ce transcrit constitue la sequence SEQ ID N°42. 

La sequence SEQ ID N°42 a une longueur de 1377 nucleotides. 

La seconde sequence nucleique partielle de I'ADNc 
20 correspondant a ce transcrit constitue la sequence SEQ ID N°43. 

La sequence SEQ ID N°43 a une longueur de 452 nucleotides. 

La troisieme sequence nucleique partielle de I'ADNc 
correspondant a ce transcrit constitue la sequence SEQ ID N°44. 
25 La sequence SEQ ID N°44 a une longueur de 562 nucleotides. 

La quatrieme sequence nucleique partielle de I'ADNc 
correspondant d ce transcrit constitue la sequence SEQ ID N°45. 

La sequence SEQ ID N°45 a une longueur de 1766 nucleotides. 

30 
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Aucune identite de sequence n'a ete retrouvee lors crime 
recherche dans la base de donn£es GenBank (Version 110). 

A partir de la sequence SEQ ID N° 42, on a synthase deux 
amorces nucleotidiques, respectivement les amorces de sequences 
5 SEQIDN°106et107. 

A partir de la sequence SEQ ID N° 43, on a synth6tis6 une 
amorce nucl£otidique de sequence SEQ ID N° 108. 

A partir de la sequence SEQ ID N° 45 t on a synthetis§ deux 
amorces nucleotidiques, respectivement les amorces de sequences 
io SEQ IDN° 109 et 110. 

Ces amorces ont permis d'amplifier une cinquieme et une sixi6me 
sequence nucleotidique representatives du transcrit du gene GS96663. 

La cinquieme sequence nucleique correspondant au transcrit du 
gene GS96663 constitue la sequence SEQ ID N° 46. La sequence ' 
is nucleique SEQ ID N° 46 a une longueur de 601 nucleotides. 

La sixieme sequence nucleique correspondant au transcrit du 
gene GS96663 constitue la sequence SEQ ID N° 47. La sequence SEQ 
ID N° 47 a une longueur de 3706 nucleotides. Elle comprend un cadre 
20 ouvert de lecture partiel allant du nucleotide en position 1 au nucleotide 
en position 3202 de la sequence SEQ ID N° 47. 

Des homologies ont ete observees entre la sequence SEQ ID 
N° 47 et des sequences r£ferencees dans la base de donnees GenBank 
(Version 116). Ces homologies sont les suivantes : 

25 

• 99 % d'homologie sur 2423 pdb (positions [1030-3451]) matchant 
avec les positions [1-2419 ] de la sequence 

gi|5102585|emb|AL079279.1|HST000009[5102585] Homo sapiens 
mRNA full length insert cDNA clone EUROIMAGE 248114 . Length = 
30 2 450; /chromosome="9" /map= M D9S176-D9S279" ; deposee le 14- 
JUN-1999; Unpublished. 
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• 98% sur 1623 pdb (positions [1946-3559] ) matchant avec les 
positions [16-1638] de la sequence 

g3012351 (176197 ) Sequence 1 from patent US 5691147.Length = 
1638 pdb; deposee le 03-APR-1998; AUTHORS: Draetta.G. and 
5 Gyuris.J. TITLE: CDK4 binding assay JOURNAL : Patent: US 
5691147-A 1 25-NOV-1997; 



• Differents fragments d'homologie de 99% a 100% sur 2372 pdb 
io (positions [1-2372]) et de 97% a 100% sur 1 160 pdb (positions [2547- 
3706]) avec la sequence 

gi|722801 6|emb|AL1 581 58.3|AL1 581 58[722801 6] ; Homo sapiens 
chromosome 9 clone RP11-427L11 map q31.2-32, *** 
SEQUENCING IN PROGRESS 37 unordered pieces ; deposee le 
15 08-MAR-2000 ; 



Les analyses d'expression du transcrit des sequences SEQ ID 
N°42 a 47 ont ete realisees par RT PCR, comme decrit dans TExemple 
20 1. Ces analyses effectuees a partir d'ARN polyA+de differents 

tissus ont permis de montrer que le gene GSS96663 eta it exprime dans 
le cerveau foetal, le foie, le cerveau, le cceur, la prostate, le placenta, le 
foie foetal, I'uterus, le testicule, le rein et le muscle squelettique. 

25 Ce gene constitue un candidat positionnel causal d'une maladie 

due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL 
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Polypeptide code par I'acide nucleique de sequence SEQ ID N° 47 

Le cadre ouvert de lecture partiel de la sequence d'acide 
nucleique SEQ ID N° 47 code potentiellement pour On polypeptide de 
1066 acides amines de longueur qui constitue la sequence SEQ ID N° 
5 155.. 

Des homologies entre la sequence SEQ ID N° 155 et des 
sequences repertories dans les bases de donne£es. Ces homologies 
sont les suivantes : 

• 27% d'homologie sur 1068 AA avec des sequences de 
io type " complement receptor" CR1 (g30186 ; g809019 ; 

g451303 ;g306680 ) et CR2 

(g 181 92 ;g181940 ;g599776) 



• Homologie de 24% sur environ 1000 AA avec des 
is sequences "complement facteur H"; sequences 

gi|31965|emb|CAA68704.1 1[31965] (Y00716) factor H 
[Homo sapiens], PIR :NBHUH et PIR :NBMSH ; 
EM:Q14006 et EM :Q61408, 



20 • Homologie de 25% sur 900 AA avec les sequences de 

P-selectin et E-selectin ; sequences 

sp|p16581|Iem2_human e-selectin precursor (endothelial 
leukocyte adhesion molecule 1) (elam-1) (leukocyte- 
endothelial cell adhesion molecule 2) (Iecam2) (cd62e) 

25 et sp|p16109|lem3Jiuman p-selectin precursor (granule 

membrane protein 140) (gmp-140) (padgem) (cd62p) 
(leukocyte-endothelial cell adhesion molecule 3) 
(Iecam3) et avec pir non-redondante: pir|s|a30359 p- 
selectin precursor - human.. 



30 
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• 24% d' homologie sur 637 AA avec la sequence 
g183391 (M25322) granule membrane protein-140 
(GMP-140) precursor [Homo sapiens] , Length = 830 

5 

• Homologie avec la "cell adhesion molecule" trEMBL: 
sp|Q28290|Q28290 CELL ADHESION MOLECULE 
PRECURSOR (FRAGMENT). 

io • Differents fragments d'homologie de 25% a 29% sur la 

sequence " apolipoprotein H precursor - 
human PIR:NBHU Length = 345; apolipoprotein H 
precursor - human, avec une homologie de 29% sur 
256 AA. 

15 

• Homologie avec des sequences M membrane 
cofacteur protein cofacteur" (PIR:S01896, 
PIR;I54479, PIR :A57278 et EM :P79138, 
EM:Q9Z0M4, EM :019121) et EM :062837 : 

20 membrane cofacteur proteine CD46. 



• Differents fragments (de 400 a 500 AA) d'homologie de 
25% a 27% avec la sequence PIR:T16833 hypothetical 
25 protein T07H6.5 - Caenorhabditis elegans retrouvee 

dans genpept (g1255889(U53344). 



30 



Fonction putative 
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Le produit du gene GS96663, de par son homologie en acides amin6s 
avec les precurseurs de la P-selectine et de la E-s6lectine humaines, 
s'apparente a cette classe de prolines membranaires. Son role dans 
I'efflux du cholesterol intracellular, medie par des proteines 
5 membranaires n'est pas exclu d'autant que le g6ne est localise dans 
['interval g6n6tique defini par clonage positionnel. 

Le polypeptide de sequence SEQ ID N° 155 est susceptible 
d'intervenir dans la regulation du flux du cho!est6rol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
io familiales en HDL, ou encore dans une maladie gen6tiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

GfeneGS941675. 

Acide(s) nucleique(s) 
1 5 II a ete isole selon invention un ARN messager correspondant a 

un transcrit du gene designe ici sous le n° GS941675. Deux sequences 

nucleiques sont representatives de ce transcrit : 

La premiere sequence nucleique de I'ADNc correspondant d ce 

transcrit constitue la sequence SEQ ID N°48. 
20 La sequence SEQ ID N°48 a une longueur de 373 nucleotides. 

La seconde sequence nucleique de TADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°49. 

La sequence SEQ ID N°49 a une longueur de 459 nucleotides. 

25 

Aucune identite de sequence n'a ete retrouvee lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

La troisieme sequence nucleique de I'ADNc correspondant a ce 
30 transcrit constitue la sequence SEQ ID N° 50. 

La sequence SEQ ID N° 50 a une longueur de 2575 nucleotides 
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Des homologies entre la sequence SEQ ID N° 50 et des 
sequences r6f§rencees dans la base de donnees GenBank (Version 
116) ont ete observees. Ces homologies sont les suivantes : 

5 - 98% d'identte sur 720 pb avec un BAC END g6348761 AQ892571 
HS_3143_A1J301_T7C CIT Approved Human Genomic Sperm Library 
lenght 848pb 

Ce gene constitue un candidat positionnel causal d'une maladie 
10 due a un dysfonctionnement du flux inverse du choiest6rol, et plus 
particulterement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31-34 du chromosome 9. 

15 GeneGS929341. 

Acide(s) nucleique(s) 

II a ete isoI6 selon invention un ARN messager correspondent a 
un transcrit du g6ne d6sign6 ici sous le n° GS929341. Deux sequences 
nucl6iques representatives de ce transcrit ont ete determines. 
20 La premtere sequence nucleique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°51. 

La sequence SEQ ID N°51 a une longueur de 231 nucleotides. 

La seconde sequence nucieique de I'ADNc correspondant a ce 
25 transcrit constitue la sequence SEQ ID N°52. 

La sequence SEQ ID N°52 a une longueur de 344 nucl6otides. 
Cette sequence comprend un cadre ouvert de lecture (ORF) partiel allant 
du nucleotide en position 3 au nucleotide en position 131 de la sequence 
SEQ ID N°52. 
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Aucune identity avec les s6quences SEQ ID N° 51 et 52 n'a ete 
retrouv6e lors d'une recherche dansHa-base-de-donnees-GenBank — 
(Version 110). 

5 La troisifeme sequence nucleique de I'ADNc correspondent a ce 

transcrit constitue la sequence SEQ ID N° 53. 

La sequence SEQ ID N° 53 a une longueur de 402 nucleotides. 
Cette s6quence comprend un cadre ouvert de lecture (ORF) partiel allant 
du nucleotide en position 1 au nucleotide en position 188 de la sequence 
10 SEQ ID N° 53. 

Aucune identite avec les sequences SEQ ID N° 51 a 53 n'a ete 
retrouvee lors d'une recherche dans la base de donn6es GenBank 
(Version 116). 

is Les analyses depression du transcrit des sequences SEQ ID 

N°51 et 52 ont ete realisees par RT PCR, comme decrit dans I'Exemple 
1. Ces analyses effectuees a partir d'ARN polyA+de differents tissus ont 
permis de montrer que le gene GS929341 etait exprime dans le cerveau 
foetal, le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal, 

20 I'uterus, le testicule, le rein, le muscle squelettique et le poumon. 

Ce gene constitue un candidat positionnel causal d'une maladie 
due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
25 familiales en HDL, ou encore a une maladie genetiquement Ii6e au locus 
9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID NO 52 

Le cadre ouvert de lecture de la sequence d'acide nucleique SEQ 
30 ID N°52 code potentiellement pour un polypeptide de 43 aminoacides de 
longueur constituant la sequence SEQ ID N°156. 
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Aucune homologie significative avec BLAST n'a 6t6 retrouvee 
avec les sequences references dans les bases de donnees Swissprot 
(version 36, derniere remise & jour du 3 mai 1999) et PRODOM: 
(domaines homologues detectes dans Swissprot, version 34.2, 
5 novembre 1997). 

Polypeptide code par I'acide nucleique de sequence SEQ ID W° 53 

Le cadre ouvert de lecture de la sequence d'acide nucleique SEQ 
ID N° 53 code potentiellement pour un polypeptide de 61 acides amines 

10 de longueur constituant la sequence SEQ ID N° 157. 

Aucune homologie significative avec BLAST n'a ete retrouvee 
avec les sequences referencees dans les bases de donn6es Swissprot 
(version 38), PIR (Version 62, Septembre 1999), trEMBL (Version de 
Aout 1999) et Gen Pept (Version 115). 

15 Les polypeptides de sequences SEQ ID N°156 et 157 sont 

susceptibles d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
familiales en HDL, ou encore dans une maladie genetiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

20 

Gene GS915742. 
Acide(s) nucleique(s) 

II a 6t6 isol6 selon I'invention un ARN messager correspondant a 
25 un transcrit du gene designe ici sous le n° GS915742. Trois sequences 
nucteiques representatives de ce transcrit ont 6te determinees. 

La premiere sequence nucleique de I'ADNc correspondant & ce 
transcrit constitue la sequence SEQ ID N°54. 

La sequence SEQ ID N°54 a une longueur de 228 nucleotides. 

30 
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La seconde sequence nucleique de TADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°55. 

La sequence SEQ ID N°55 a une longueur de 270 nucleotides. . 

5 La troisieme sequence nucleique de I'ADNc correspondant a ce 

. transcrit constitue la sequence SEQ ID NT 56. 

La sequence SEQ ID N° 56 a une longueur de 1 130 nucleotides. 
Aucune identite de sequence n'a 6t6 retrouvee lors d'une 
recherche dans la base de donn§es GenBank (Versions 1 10 et 1 16). 

10 

Les analyses d'expression du transcrit des sequences SEQ ID 
N°54 et 55 ont ete realisees par RT PCR, comme decrit dans I'Exemple 
1. Ces analyses effectuees a partir d'ARN polyA+de differents tissus ont 
permis de montrer que le gene GS915742 etait exprime dans le cerveau 
1 5 foetal, le foie, le placenta et le rein. 

Ce gene constitue un candidal positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
20 particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore 3 une maladie g6n6tiquement Ii6e au locus 
9q31-34 du chromosome 9. 

25 Gene GS913018. 

Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant & 

un transcrit du gene d6sign6 ici sous le n° GS913018. Deux sequences 

representatives de ce transcrit sont representees ci-apr6s. 
30 La premiere sequence nucleique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°57. 
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La sequence SEQ ID N°57 a une longueur de 463 nucleotides. 

La seconde sequence nucldique de I'ADNc correspondent a ce 
transcrit constitue la sequence SEQ ID N°58. 
5 La sequence SEQ ID N°58 a une longueur de 289 nucleotides. 

Aucune identite de sequence avec les sequences SEQ ID N° 57 
et 58 n'a ete retrouv6e lors d'une recherche dans la base de donnees 
GenBank (Version 110). 

A partir de la sequence SEQ ID N° 57, on a synth6tis6 deux 
io amorces nucleotidiques, respectivement les. amorces de s6quences 
SEQ ID N° 111 et 112. 

A partir de la sequence SEQ ID N° 58, on a synthetise deux 
amorces nucleotidiques, respectivement les amorces de sequences 
SEQ ID N° 113 et 114. 
15 Les amorces de sequences SEQ ID N° 111 a 114 ont permis 

d'amplifier un ADNc, a partir d'une banque d'ARNm polyA+ de 
differentes tissus humains commercialism par la Soci6t6 Clontech une 
troisieme sequence nucleique de I'ADNc correspondant au transcrit du 
gene GS913018. 

20 

La troisieme sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N° 59. 

La sequence SEQ ID N° 59 a une longueur de 1542 nucleotides. 

Des homologies ont ete retrouv6es sur la sequence SEQ ID N° 
25 59, en particulier differents fragments d'identite sur les positions [735- 
1268] [1-357] [559-710] et [373-501] de la sequence SEQ ID N° 59 avec 
la sequence g6563616 (AC013740)Homo sapiens clone RP1 1-1 15J22, 
WORKING DRAFT SEQUENCE, 15 unordered pieces.Length = 180711, 
reepertoriees dans GenBank (Version 116). 
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Les analyses ^expression du transcrit des sequences SEQ ID 
N°57 et 58 ont et6 r6alis6es par RT PCR, comme decrit dans I'Exemple 
1 . Ces analyses effectives a partir d'ARN polyA+de differents tissus ont 
per'mis de montrer que le gene GS913018 etait exprime dans le cerveau 
5 foetal, le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal, 
I'uterus, le testicule et le rein. 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
io particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie g6n£tiquement liee au locus 
9q31-34 du chromosome 9. 

Gene GS911742. 
Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designe ici sous le n° GS911742. Trois sequence 
representatives de ce transcrit ont et£ determinees. 

La premiere sequence nucleique de I'ADNc correspondant A ce 
transcrit constitue la sequence SEQ ID N°60. 

La sequence SEQ ID N°60 a une longueur de 1417 nucleotides. 

La seconde sequence nucleique de I'ADNc correspondant a ce 
25 transcrit constitue la sequence SEQ ID N°61. 

La sequence SEQ ID N°61 a une longueur de 696 nucleotides. 

Aucune identite de sequence avec les sequences SEQ ID N° 60 
et 61 n'a 6t6 retrouv6e lors d'une recherche dans la base de donnees 
30 GenBank (Version 1 1 0). 



15 
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La troisieme sequence nucieique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N° 62. 

La sequence SEQ ID N° 62 a une longueur de 2702 nucleotides. 
Cette sequence comprend un cadre ouvert de lecture (ORF) partiel allant 
5 du nucleotide en position 1 au nucleotide en position 792 de la sequence 
SEQ ID N° 62. La sequence codante potentielle debute au nucleotide en 
position 49 et se termine au nucleotide en position 792 de la sequence 
SEQ ID NT 62. Le codon d'initiation de la traduction debute au nucleotide 
en position 49 de la sequence SEQ ID N° 62. Cette sequence comprend 
io un motif de Kozak de seuqence u GC CGC GCC ATG C " qui debute au 
nucleotide en position 41 de la sequence SEQ ID N° 62. 

Des homologies avec la sequence SEQ ID N° 62 ont ete 
observees avec des sequences repertoriees dans la base de donn6es 
GenBank (Version 116). Ces homologies sont les suivantes : 

is 

t 98 % d'homologie sur 1410 pdb (positions [4-1413]) avec la 
sequence gi|5912095|emb| 

AL117557.1|HSM801083[5912095] Homo sapiens mRNA; cDNA 
DKFZp564D177 (from clone DKFZp564D177); partial cds. Length = 
20 1431; deposee le 18-FEB-2000; Submitted (15-SEP-1999) MIPS, 
Am Ktopferspitz 18a, D-82152 Martinsried, GERMANY, Bloecker.H., 
Boecher.M., Brandt.P., Wiemann.S. 



25 ♦ 97 % d'homologie sur 10139 pdb (1-1039] et 97% sur 380 pdb [1082- 
1458] et 90% sur 51 pdb [1506-1556] avec la sequence 
gi|6841247|gb|AFl61417.1|AF161417[6841247] Homo sapiens 
HSPC299 mRNA, partial cds. Length = 1659; deposee le 01-FEB- 
2000; Direct Submission; Submitted (14-MAY-1999) Shanghai 

30 Institute of Hematology, Shanghai Second Medical University, Rui-Jin 
Hospital, 197 Rui-Jin Road II, 
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• 98 % d'homologie sur 1410 pdb (4-1413] avec la sequence g5912095 
(AL1 17557) Homo sapiens mRNA; cDNA DKFZp564D177 (from 
clone DKFZp564D177); partial cds. Length = 1431; deposee le 18- 
FEB-2000 ; Direct Submission ; Submitted (15-SEP-1999) MIPS, Am 

5 Klopferspitz 18a ( D-82152 ; Martinsried, GERMANY, Bloecker.H.. 
Boecher.M., Brandt.P., Mewes.H.W., Gassenhuber.J. and 
Wiemann.S. 

• 93% sur 911 pdb (positions [1-911] ) et 93% sur 179 pdb( positions 
10 [1395-1573]) et 81% sur 131 pdb (positions [992-1122] )avec la 

sequence gi|7023832|dbj|AK0021 37.1 |AK0021 37[7023832] Homo 
sapiens cDNA FLJ11275 fis, clone PLACE1009375. Length = 1564; 
deposee le 22-FEB-2000 ; NEDO human cDNA sequencing project ; 
Unpublished 

15 

• Differents fragments d'homologie( de 90% a 100%) avec la 
sequence g5932616 (AC009594) Homo sapiens chromosome 4 
clone 363J3JJ1 map 4 ( *** SEQUENCING IN PROGRESS 9 
unordered pieces. Length = 150108; 

20 

Les analyses d'expression du transcrit des sequences SEQ ID 
N°60 et 61 ont 6t6 r6alisees par RT PCR, comme d§crit dans I'ExempIe 
1. Ces analyses effectuees & partir d'ARN polyA+de differents tissus ont 
permis de montrer que le gene GS911742 etait exprim6 dans le cerveau 
25 foetal, le foie. le coeur et le placenta. 

De plus, une analyse de I'expressipn du transcrit par Northern 
blot, , selon le protocole decrit de I'Exemple 1, a Taide de la sonde de 
sequence SEQ ID NO 101, a revele la presence de transcrits dans le 
30 blot commercialise par la Soci6t6 Clontech (Ref. N° 7759-1). 
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La taille des transcrits detects avec la sonde de sequence SEQ 
ID N°101 est de 1,9 kb dans le pancreas, le rein, le muscle squelettique, 
le poumon et le placenta. 

5 Ce gene constitue un candidat positionnel causal d'une maladie due S 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL 

io Polypeptide code par I'acide nucleique de sequence SEQ ID NO 62 

Le cadre ouvert de lecture partiel de la sequence d'acide 
nucleique SEQ ID N°62 code potentiellement pour un polypeptide de 
263 aminoacides de longueur constituant la sequence SEQ ID N°158. 

Homologies observees au niveau de la sequence prot6ique 
1 5 traduite en six phases : 

• 99% d'homologie sur 262 AA (position [4-789]) avec la sequence 
g5912096 (AL1 17557) hypothetical protein [Homo sapiens] Length = 
263; note= "similarity to NIPSNAP1" ; deposee le 18-FEB-2000 ; 
Direct Submission ; Submitted (15-SEP-1999) MIPS, Am Klopferspitz 

20 18a, D-82152 , Martinsried, GERMANY, Bloecker.H., Boecher,M., 
Brandt.P., Mewes.H.W., Gassenhuber.J. and Wiemann,S, 

• Homologies avec des sequences NISNAP2 et NISNAP2 : 

27 % d'homologie sur 179 AA avec la sequence g2769254 
25 (AJ001259) NIPSNAP2 protein [Homo sapiens] Length = 285 et 24% 
d'homologie sur 211 AA avec la sequence g2769649 (AJ001258) 
NIPSNAP1 protein [Homo sapiens] Length = 284 

• 27 % d'homologie sur 179 AA avec la sequence g3403167 
30 (AF029786) GBAS [Homo sapiens] 
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Length = 286 . GBAS : guanine nucletide-binding protein, alpha- 
subunit (adenylate cyclase-stimulating G alpha protein). 
Cette proteine est decrite avec un site de phosphorylation et une 
region transmembranaire. 
5 Les " guanine nucletide-binding proteins " ont un role de modulateurs 
ou transducteurs dans differents sytemes de signalisation 
transmembranaires. 

21% d'identite avec la prot6ine YMQ1_CAEEL (Base de donnees 
10 Prodom, VERSION ?) qui a une simiralite avec la prot6ien SNAP25 et 
la 4-nitrophenylphosphatase. 

Le polypeptide de sequence SEQ ID N° 158 comprend 
des sites de glycosylate, des sites de phosphorylation tels que des 
1 5 sites de phosphorylation cAMP- et cGMP-d6pendants de proteine kinase 
et de caseine kinese de type II. 



20 Fonction putative : 

Le polypeptide de sequence SEQ ID N°158 s'apparente done par son 
motif retrouv§ .dans le domaine PD013981 de PRODOM: (domaines 
homologues detectes dans Swissprot, version 34.2, novembre 1997) a 
une proteine putativement impliqu6e dans le transport v6siculaire 

25 intracellular. Ce mecanisme sous-tendu par un adressage sp6cifique 
rnedie par ces prolines est d'interet par rapport a la maladie de 
Tangier/FHD qui est decrite par un defaut du mecanisme de transport et 
de translocation des pools de cholesterol intracellular vers les 
particules HDL acceptrices. Le polypeptide de sequence SEQ ID N°158 
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est done susceptible d'intervenir dans une etape importante impliquee 
dans le transport inverse du cholesterol par les HDL. 

Le polypeptide de sequence SEQ ID N° 158 est susceptible 
5 d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des d§ficiences 
familiales en HDL, ou encore dans une maladie genetiquement Ii6e au 
locus 9q31-34 du chromosome 9. 

10 Gene GS98601. 

Acide(s) nucleique(s) 

II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designs ici sous le n° GS98601. Trois sequences 
nucl6iques representatives de ce transcrit ont ete determinees. 
is La premiere sequence nucleique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°63. 

La sequence SEQ ID N°63 a une longueur de 335 nucleotides. 
Aucune identite de sequence n'a ete retrouvSe lors d'une 
recherche dans la base de donnees GenBank (Version 110). 

20 

La seconde sequence nucleique de I'ADNc correspondant d ce 
transcrit constitue la sequence SEQ ID N°64. 

La sequence SEQ ID N°64 a une longueur de 447 nucleotides. 
Aucune identity de sequence n'a 6t6 retrouvee lors d'une 
25 recherche dans la base de donnees GenBank (Version 110). 

La troisieme sequence nuclSique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°65. 

La sequence SEQ ID N°65 a une longueur de 2324 nucI6otides. 



WO 00/71710 



92 



PCT/FR00/01426 



Cette s6quence comprend un cadre ouvert de lecture (ORF) 
partiel allant du nucleotide en position 3 au nucleotide en position 611 de 
la sequence SEQ ID N°65. 

Homologies observees au niveau de la sequence nucl6otidique : 
5 (307) 

• 99% d'homologie sur 514 pb (position 1508-2021 pb) 
avec des s6quences de GenBank: gi|3483520| 
correspondant au clone ZB95F02 d'ADNc (Homo 

io sapiens) dont la sequence est complete. 

• 98% d'homologie sur 170 pb (position 862-1031 pb) 
avec des sequences de GenBank: gi| 11 84671 1 ( region 
3'UTR partielle de TARN m, codant pour la proteine 

15 inductible du virus de la maladie de newcastle) 

Les analyses d'expression du transcrit de sequence SEQ ID N°45 
ont 6t6 r6aiis6es par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectuees a partir d'ARN polyA+de differents tissus ont permis 
20 de montrer que le gene GS98601 etait exprime dans le cerveau, le 
placenta et I'ut6rus. 

Ce g6ne constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
25 particuli6rement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore a une maladie genetiquement liee au locus 
9q31 -34 du chromosome 9. 
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Polypeptide code par I'acide nucleique de sequence SEQ ID NO 65 

Le cadre ouvert de lecture de la troisieme sequence d'acides 
nucleiques SEQ ID N°65 code potentiellement pour un polypeptide de 
203 aminoacides de longueur constituant la sequence SEQ ID N°159. 
5 Homologies observees au niveau de la sequence proteique (307): 

34% d'homologie sur 180 aa (position 3-182 aa) avec des sequences de 
Genpept:* (traduction de Genbank v1 10 et 111, derniere remise a jour le 
7 mai 1999); gi|3878571 |gnl|PID|e1 3481 03 (Z46381)- faible similarity 
avec la prot6ine de levure Ysy6 - (PIR: (SEQUENCES PIR NON 

10 REDONDANTES, VERSION 57) num6ro d'acc6s JQ0912);EST d'ADNc 
EMBLD32318 provient de ce g6ne ; EST d'ADNc EMBLD33688 
provient de ce gene EST d'ADNc EMBL:D34664 provient de ce g&ne ; 
EST d'ADNc EMBLD36574 provient de ce gene et des sequences de 
SP-TrEMBL (SP-TrEMBL, version 7, novembre 1998): sp|Q21453| 

is correspondant a la proteine M01F1.4 de C elegans 

Le polypeptide de sequence SEQ ID N° 159 est susceptible 
d'intervenir dans la regulation du flux du cholesterol, et plus 
particulierement de la maladie de Tangier, dans des deficiences 
20 familiales en HDL, ou encore dans une maladie g£n6tiquement liee au 
locus 9q31-34 du chromosome 9. 

Fonction putative : 

Ce gene est un candidat par sa localisation chromosomique pour les 
25 pathologies Tangier/FHD. 

Gene GS94852. 
Acide(s) nucleique(s) 
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II a ete isole selon I'invention un ARN messager correspondant a 
un transcrit du gene design^ ici sous le n° GS94852. Trois sequences 
nucleiques representatives de ce transcrit ont ete determines. 

La premiere sequence nucieique de I'ADNc correspondant a ce 
5 transcrit constitue la sequence SEQ ID N°66. . 

La sequence SEQ ID N°66 a une longueur de 447 nucleotides. 

La seconde sequence nucieique de I'ADNc correspondant £ ce 
transcrit constitue la sequence SEQ ID N°67. 
10 La sequence SEQ ID N°67 a une longueur de 564 nucleotides. 

A partir de la sequence SEQ ID N° 66, on a synthetis6 deux 

amorces nucleotidiques, respectivement les amorces de sequences 

SEQ ID N° 115 et 116. 
15 A partir de la sequence SEQ ID N° 67, on a synthetise deux 

amorces nucleotidiques, respectivement les amorces de sequences 

SEQIDN°117et118 

.Les amorces de sequences SEQ ID. N° 115 a 118 ont permis 

d'amplifier un ADNc, a partir d'une banque d'ARNm polyA+ de differents 
20 tissus humains commercialisee par la Societe Clontech une troisieme 

sequence nucieique de I'ADNc correspondant au transcrit du g6ne 

GS94852. 

La troisieme sequence nucieique correspondant au transcrit du 
gene GS94852 constitue la sequence SEQ ID N° 68. 
25 La sequence SEQ ID N° 68 a une longueur de 604 nucleotides. 

Aucune identity de sequence avec les sequences SEQ ID N° 66 a 
68 n'a ete retrouvee lors d'une recherche dans Ja base de donn6es 
GenBank (Versions 110 et 116). 

30 
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Les analyses depression du transcrit de sequence SEQ ID N°67 
ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. Ces 
analyses effectives a partir d'ARN polyA+de differents tissus ont permis 
de-montrer que le gene GS94852 etait exprim6 dans le foie et le coeur. 

5 

Ce g6ne constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulterement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie g6netiquement Ii6e au locus 
10 9q31-34 du chromosome 9. 

GeneS935135. 
Acide(s) nucleique(s) 

II a et6 isole selon I'invention un ARN messager correspondant a 
1 5 un transcrit du gene designe ici sous le n° GS935135. Trois sequences 
nucl6iques representatives de ce transcrit ont ete d£terminees. 

La premiere sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°69. 

La sequence SEQ ID N°69 a une longueur de 482 nucleotides. 

20 

La seconde sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°70. 

La sequence SEQ ID N°70 a une longueur de 402 nucleotides. 

Aucune identite de sequence n'a ete retrouv6e avec les 
25 sequences SEQ ID NT 69 et 70 lors d'une recherche dans la base de 
donnees GenBank (Version 110). 

On a synthetise une premiere amorce nucleotidique de sequence 
SEQ ID N° 119 a partir de la sequence SEQ ID N°69 et une seconde 
30 amorce nucl6otidique de sequence SEQ ID N 120 d partir de la 
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sequence SEQ ID N° 70. Ces amorces ont permis d'amplifier une 
troisieme sequence nucleique repr6sentatve du transcrit du gene 
GS935135 constituant la sequence SEQ ID N° 71. 

La sequence nucleiqque SEQ ID N° 71 a une longueur de 758 
5 nucleotides. 

Des homologies ont ete retrouv§es avec des sequences 
repertories dans la base de donnees GenBank (Version 116). Ces 
homologies sont les suivantes : 

io • 80 a 85% d'homologie sur 3 fragments ( 156+197+93 pdb) avec la 
sequence g2168141 
(gi|2168141|emb|293019.1|HS49C23[2168141) Human DNA 
sequence from PAC 49C23 on chromosome X contains malate 
dehydrogenase pseudogene and STS. Length = 153078 

15 

• 81% a 90% d'homologie sur 4 fragments ( 144+86+197+137 pdb) 
avec la sequence g2828782 

(gi|2828782|gb|AC002319.1|AC002319[2828782J) Homo sapiens 
20 chromosome 9q34, clone 70C11, complete sequence. Length = 
46305 



25 Les analyses d'expression du transcrit de sequence SEQ ID N°69 

ou 70 ont ete r6alisees par RT PCR, comme decrit dans I'Exemple 1. 
Ces analyses effectuees a partir d'ARN polyA+de differents tissus ont 
permis de montrer que le gene GS935135 6tait exprim6 dans le cerveau 
foetal, le foie, le cerveau, la prostate, le placenta, le foie foetal, I'uterus, le 

30 testicule et le rein. 
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Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie g6n6tiquement Itee au locus 
5 9q31-34 du chromosome 9. 

Gene GS914669. 
Acide(s) nucleique(s) 
io II a et6 isole selon I'invention un ARN messager correspondant a 

un transcrit du gene designe ici sous le n° GS914669. Trois sequences 
nucleiques representatives de ce transcrit ont 6t6 d6termin6es. 

La premiere sequence nucleique de I'ADNc correspondant d ce 
15 transcrit constitue la sequence SEQ ID N°72. 

La sequence SEQ ID N°72 a une longueur de 673 nucleotides. 

La seconde sequence nucleique de I'ADNc correspondant a ce 
transcrit constitue la sequence SEQ ID N°73. 
20 La sequence SEQ ID N°73 a une longueur de 554 nucleotides. 

Aucune identite de sequence avec les sequences SEQ ID N° 72 
et 73 n'a ete retrouvfee lors d'une recherche dans la base de donnees 
GenBank (Version 110). 
25 A partir de la sequence SEQ ID N° 72, on a synth6tis6 deux 

amorces nucteotidiques, respectivement les amorces de sequences 
SEQ ID N? 121 et122. 

A partir de la sequence SEQ ID N° 73, on a synthetise deux 
amorces nucleotidiques, respectivement les amorces de sequences 
30 SEQ IDN° 123 et 124. 
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.Les amorces de sequences SEQ ID N° 121 a 124 ont permis d'amplifier 
un ADNc, a partir d'une banque d'ARNm polyA+ de differents tissus 
humains commercialisee par la Societe Clontech une troisieme 
sequence nucleique de I'ADNc correspondent au transcrit du gene 

5 GS914669. Cette sequence constitue la sequence SEQ ID N° 74. La 
sequence SEQ ID N° 74 a une longueur de 1794 nucleotides. Elle 
comprend un cadre ouvert de lecture allant du nucleotide en position 1 
au nucleotide en position 258 de la sequence SEQ ID N° 74 ainsi qu'une 
sequence codante localisee identiquement. Cette sequence comprend 

io un site de polyadenylation debutant au nucleotide en position 1751 de la 
SEQ ID NT 74. 

Des homologies avec la sequence SEQ ID N° 74 ont ete 

retrouvees dans les sequences repertoriees dans la base de donnees 

GenBank (Version 116). Ces homologies sont les suivantes : 
I5 99% d'identite sur 1000pb (792 a 1793pb) g6807977 AL137422 Homo 

sapiens mRNA; cDNA DKFZp761A1623 (from clone DKFZp761A1623); 

partial cds Length = 1000 

Identite avec un BAC en cours de sequen9age AL1 37023 g6982086 
20 Homo sapiens chromosome 9 clone RP11-403A22 map q34.13-34.3, *** 
SEQUENCING IN PROGRESS 19 unordered pieces. Length = 
184814 

Les analyses d'expression du transcrit de sequence SEQ ID N°72 
25 ou 73 ont ete realisees par RT PCR, comme d6crit dans I'Exemple 1. 
Ces analyses effectuees a partir d'ARN polyA+de differents tissus ont 
permis de montrer que le gene GS914669 etait exprime dans le cerveau 
foetal et le coeur. 

so Ce gene constitue un candidal positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
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familiales en HDL, ou encore a une maladie genetiquement li§e au locus 
9q31-34 du chromosome 9. 

Polypeptide code par I'acide nucleique de sequence SEQ ID W° 74 
5 Le cadre de lecture ouvert de la sequence d'acide nucteique SEQ 

ID N° 74 code potentiellement pour le polypeptide de sequence SEQ ID 

N° 160 d'une longueur de 85 acides amines. 

Aucune homologie de sequence n'a ete observee avec les 

sequences repertories dans les bases de donnees Genpept (Version 
10 .115), Swissprot (Version 38), trEMBL (Version de Aout 1999) et PIR 

(Version 62 de Septembre 1999). 

Gene GS913839. 
Acide(s) nucleique(s) 
15 II a §te isole selon Tinvention un ARN messager correspondant a 

un transcrit du gene designe ici sous le n° GS913839. Trois s6quences 
nucteiques representatives de ce transcrit ont ete determinees. 

La premiere sequence nucleique de TADNc correspondant a ce 
20 transcrit constitue la sequence SEQ ID N°75. 

La sequence SEQ ID N°75 a une longueur de 507 nucleotides. 

La seconde sequence nucleique de TADNc correspondant d ce 
transcrit constitue la sequence SEQ ID N°76. 
25 La sequence SEQ ID N°76 a une longueur de 415 nucleotides. 

Aucune identite de sequence avec les sequences SEQ ID N° 75 
et 76 n'a 6t6 retrouvee lors d'une recherche dans la base de donn6es 
GenBank (Version 110). 
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A partir de la sequence SEQ ID N° 75, on a synthetise une 
amorce nucleotidique de sequence SEQ ID N° 125. 

A partir de la sequence SEQ ID N°.76, on a synthase une 
amorce nucleotidique de sequence SEQ ID N° 1126 
5 .Les amorces de sequences SEQ ID N° 125 et 126 ont permis 

d'amplifier un ADNc, a partir d'une banque d'ARNm polyA+ de differents 
tissus humains commercialisee par la Soci6te Clontech une troisieme 
sequence nucleique de I'ADNc correspondant au transcrit du gfene 
GS94852. Cette sequence constitue la sequence SEQ ID N° 77. 
io La sequence SEQ ID N° 77 a une longueur de 1318 

nucleotides. 

Des homologies de la sequence SEQ ID N° 77 ont et6 
observees avec des sequences repertories dans la base de donnees 
GenBank (Version 116). Ces homologies sont les suivantes : 

I5 

• 99% d'homologie sur 1320 pdb (positions [1-1318]) avec la sequence 
g6006243 (AC011096) Homo sapiens clone 2_D_21, *** 
SEQUENCING IN PROGRESS ***, 15 unordered pieces.Length = 
135130; 

20 

• .99% d'homologie sur 1320 pdb (positions [1-1318]) avec la sequence 
g7263520 (AL161631) Homo sapiens chromosome 9 clone RP11- 
70K10, SEQUENCING IN PROGRESS 45 unordered pieces. 

25 Length = 100562; 



30 



Les analyses d'expression du transcrit de sequence SEQ ID N°75 
ou 76 ont ete realisees par RT PGR, comme decrit dans TExemple 1. 
Ces analyses effectuees a partir d'ARN polyA+de diff6rents tissus ont 
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permis de montrer que le gene GS913839 6tait exprimS dans le cerveau 
foetal et le foie. 

Ce gene constitue un candidat positionnel causal d'une maladie 
5 due a un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des deficiences 
familiales en HDL, ou encore a une maladie g6n6tiquement liee au locus 
9q31-34 du chromosome 9. 

10 

Gene GS912639. 
Acide(s) nucleique(s) 

II a 6t6 isole selon I'invention un ARN messager correspondant a 
un transcrit du gene designe ici sous le n° GS912639. Trois sequences 
15 nucteiques representatives de ce transcrit ont 6t6 determinees. 

La premiere sequence nucleique de TADNc correspondant & ce 
transcrit constitue la sequence SEQ ID N°78. 

La sequence SEQ ID N°78 a une longueur de 530 nucleotides. 

20 La seconde sequence nucleique de I'ADNc correspondant a ce 

transcrit constitue la sequence SEQ ID N°79. 

La sequence SEQ ID N°79 a une longueur de 495 nucleotides. 

Aucune identite de sequence avec les sequences SEQ ID N° 78 
et 79 n'a ete retrouvee lors d'une recherche dans la base de donnees 
25 GenBank (Version 110). 

A partir de la sequence SEQ ID N° 78 t on a synth§tis§ une 
amorce nucl6otidique de sequence SEQ ID N° 127. 

A partir de la sequence SEQ ID N° 79, on a synth6tis6 une 
amorce nucleotidique de sequence SEQ ID N° 128 
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.Les amorces de sequences SEQ ID N° 127 et 128 ont permis 
d'amplifier un ADNc, a partir d'une banque d'ARNm polyA+ de difterents 
tissus humains commercialisee par la Soci6t6 Clontech une troisieme 
sequence nucteique de I'ADNc correspondant au transcrit du gene 
5 GS912639. Cette sequence constitue la sequence SEQ ID N° 80. 

La sequence SEQ ID N° 80 a une longueur de 594 nucleotides. 

Des homologies de sequence de la sEQ ID N° 80 ont 6t6 
retrouvees avec des s6quences referencees dans la base de donn6es 
GenBank (Version 116). Ces homologies sont les suivantes ; 

10 

• 99% d'homologie sur 522 pdb (positions [204-725]) avec la 
sequence g26034 15 (gi|2603415|gb| 

B5 11 78. 1 |B51 1 78[26034 1 5]) CIT978SK-95K15.TV CIT978SK Homo 
sapiens genomic clone 95K15, genomic survey sequence.Length = 524; 

15 

• 99% d'homologie sur 501 pdb(positions [204-704] ) avec la 
sequence g2866378 (gi|2866378|gb|B79355.1 
|B79355[2866378]) CIT978SK-95K15.TV.1 CIT978SK Homo sapiens 

genomic clone 95K15, genomic survey sequence.Length = 529; 

20 

• 94% d'homologie sur 309 pdb (positions [205-513] ) avec la 
sequence g2602442 (i|2602442|gb|B50205.1| 
B50205[2602442] ) CIT978SK-96F5.TV CIT978SK Homo sapiens 

genomic clone 96F5,genomic survey sequence.Length = 309; 

25 

Les analyses d'expression du transcrit de sequence SEQ ID N°78 
ou 79 ont ete realisees par RT PCR, comme decrit dans I'Exemple 1. 
Ces analyses effectu6es a partir d'ARN polyA+de diff6rents tissus ont 
permis de montrer que le gene GS912639 6tait exprim6 dans le foie. 

30 
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Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
particulierement de la maladie de Tangier ou encore des d6ficiences 
familiales en HDL, ou encore 3 une maladie g6netiquement liee au locus 
5 9q31-34 du chromosome 9. 

Gene GS93363Q. 
Acide(s) nucleique(s) 

II a §t§ isole selon ('invention un ARN messager correspondant a 
10 un transcrit du gene design^ ici sous le n° GS933630. Une sequence 
nucleique representative de ce transcrit a ete determine. 

Cette sequence nucleique de I'ADNc correspondant d ce transcrit 
constitue la sequence SEQ ID N°81. 

La sequence SEQ ID N° 81 a une longueur de 582 nucleotides. 
15 Aucune homologie n'a ete observ6e avec les sequences 

r6ferencees dans la base de donnees GenBank (Version 116). 

Ce gene constitue un candidat positionnel causal d'une maladie due a 
un dysfonctionnement du flux inverse du cholesterol, et plus 
20 particulierement de la maladie de Tangier ou encore des d^ficiences 
familiales en HDL, ou encore d une maladie g6netiquement Ii6e au locus 
9q31-34 du chromosome 9. 

Caracteristiques de Pinvention 

25 

L'invention concerne ainsi un acide nucleique codant pour une 
proline ayant une sequence en acides amines choisie dans le groupe 
des sequences d'aminoacides SEQ ID N°129 a SEQ ID N°160 ou un 
fragment peptidique ou un variant de cette derniSre ou un acide 
30 nucleique de sequence comptementaire. 
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De maniere generate, les acides nucleiques selon ('invention se 
presentent sous une forme isolee ou purifiee. 

[.'invention concerne egalement un acide nucleique comprenant 

5 au moins huit nucleotides consecutifs d'un polynucleotide choisi dans le 
groupe constitue des sequences nucleotidiques SEQ ID N°1 a SEQ ID 
N°81 et SEQ ID N°82 a SEQ ID N°101, ou un acide nucleique de 
sequence complementaire. 

invention est aussi relative £ un acide nucleique comprenant au 

io moins 20, 30, 40, 50, 100 ou 150 nucleotides consecutifs d'un 
polynucleotide choisi dans le groupe constitue des sequences 
nucleotidiques SEQ ID N°1 a SEQ ID N°81 et SEQ ID N°82 & SEQ ID 
N°101, ou un acide nucleique de sequence complementaire. 

Selon un autre aspect, I'invention concerne aussi un acide 

1 5 nucleique ayant au moins 90% d'identite en nucleotides avec un acide 
nucleique choisi dans le groupe constitue des sequences nucleotidiques 
SEQ ID N°1 a SEQ ID N°81 et SEQ ID N°82 a SEQ ID N°101, 
avantageusement 80%, de preference 95 ( 99%, 99,5%, et de maniere 
tout a fait pr6fer6e 99,8% d'identite en nucleotides avec un acide 

20 nucleique choisi dans le groupe constitue des sequences nucleotidiques 
SEQ ID N°1 £ SEQ ID N°81 et SEQ ID N°82 a SEQ ID N°101, ou un 
acide nucleique de sequence complementaire. 

Selon encore un autre aspect, ['invention est relative a un acide 
nucleique hybridant, dans des conditions d'hybridation de forte 

25 stringence, avec un acide nucleique tel que defini ci-avant, et plus 
particulierement un acide nucleique choisi dans le groupe constitue des 
sequences nucleotidiques SEQ ID N°1 d SEQ ID N°81 et SEQ ID N°82 a 
SEQ ID N°101, ou un acide nucleique de sequence complementaire. 

30 Comme cela a 6t6 decrit en details plus haut, chacune des 

sequences nucleotidiques SEQ ID N°1 a SEQ ID N°81 constitue des 
ADNc dont la sequence nucleotidique est retrouv6e dans les transcrits 
de genes potentiellement impliques dans des affections liees a un 
dysfonctionnement du metabolisme des lipoproteines, en particulier le 

35 transport inverse du cholesterol. 
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Pour certains de ces acides nucleiques, une phase de lecture 
ouverte a ete determine, qui code pour un polypeptide dont une 
alteration dans la sequence d'acides amines ou dans I'expression est 
potentiellement associee a I'une de ces affections, ce qui indique que les 
5 sequences nucleotidiques comprenant les phases de lecture ouvertes 
constituent des acides nucleiques d'int6r§t potentiellement 
therapeutique. 

En consequence, Pinvention a en outre pour objet un acide 
nucteique ayant au moins 80% d'identite en nucleotides avec un 
10 polynucleotide comprenant, ou alternativement constitue de, un cadre de 
lecture ouvert complet ou partiel, tel que defini ci-avant dans la presente 
description. 

Les acides nucleiques ci-dessus qui comprennent, totalement ou 
partiellement, la region codante des produits de transcription de 
15 sequences SEQ ID N°1 a SEQ ID N°81 peuvent etre exprim6s dans une 
cellule hote desiree, lorsque ces acides nucl6iques sont places sous le 
controle de signaux d'expression convenables. 

De tels signaux d'expression peuvent etre indifferemment les 
signaux d'expression contenus dans les regions r6gulatrices de chacun 
20 des genes correspondants ou au contraire constitu§s des sequences 
nucleiques regulatrices exog6nes. 

Un tel acide nucleique plac6 sous le . controle d'une sequence 
regulatrice fonctionnelle dans la cellule hote dfesiree peut etre aussi 
insere dans un vecteur en vue de son expression. 

25 

SONDES ET AMORCES NUCLEOTIDIQUES 

Les fragments d'acides nucleiques derives de Tune quelconque 
des sequences nucleotidiques SEQ ID N°1 a SEQ ID N°81 sont utiles 
30 pour la detection de la presence d'au moins une copie d'une sequence 
nucleotidique choisie parmi les sequences SEQ ID N°1 a SEQ ID N°81 
ou encore d'un fragment ou d'un variant de .cette derniere dans un 
6chantillon. 

Les sondes ou les amorces nucleotidiques selon I'invention 
35 comprennent au moins huit nucleotides cons6cutifs d'un acide nucl6ique 
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choisi dans le groupe constitue des sequences SEQ ID N°1 a SEQ ID 
N°81, ou d'un acide nucleique de sequence complementaire. 

De preference, des sondes ou amorces nucieotidiques selpn 
Hnyention auront une longueur de 10, 12. 15, 18 ou 20 £ 25, 35, 40, 50, 
70, 80, 100, 200, 500, 1000, 1500 nucleotides cons6cutifs d'un acide 
nucleique selon I'invention, en particulier un acide nucleique de 
sequence nucieotidique choisie parmi les sequences SEQ ID N°1 £ SEQ 
ID N°81 ou d'un acide nucleique de sequence complementaire. 

Alternativement, une sonde ou une amorce nucieotidique selon 
I'invention consistera et/ou comprendra les fragments d'une longueur de 
12, 15, 18, 20, 25, 35, 40, 50, 100, 200, 500, 1000, 1500 nucleotides 
consecutifs d'un acide nucleique selon I'invention, plus particuiierement 
d'un acide nucleique choisi parmi les sequences SEQ ID N°1 a SEQ ID 
N°81, ou d'un acide nucleique de sequence complementaire. 

La definition d'une sonde et d'une amorce nucieotidique selon 
I'invention englobe done des oligonucleotides qui hybrident, dans les 
conditions d'hybridation de forte stringence d6finies ci-avant t avec un 
acide nucleique choisi parmi les sequences SEQ ID N°1 a SEQ ID N°81 
ou avec une sequence complementaire de ces derniers. 

Des sondes et amorces preferees selon I'invention comprennent 
tout ou partie d'un polynucleotide choisi parmi les sequences 
nucieotidiques SEQ ID N°82 a 101, ou des acides nucieiques de 
sequence complementaire, ou encore parmi les sequences 
nucieotidiques SEQ ID N° 102 a 128, ou des acides nucieiques de 
sequence complementaire. 

Une amorce ou une sonde nucieotidique selon I'invention peut 
etre pr6par6e par toute methode adaptee bien connue de I'homme du 
metier, y compris par clonage et action d'enzymes de restriction ou 
encore par synthese chimique directe selon des techniques telles que la 
methode au phosphodiester de NARANG et al. (1979) ou de BROWN et 
al. (1979), la methode aux diethylphosphoramidites de BEAUCAGE et 
al. (1980) ou encore la technique sur support solide decrite dans le 
brevet EU N°EP 0 707 592. 

Chacun des acides nucieiques selon I'invention, y compris les 
sondes et amorces oligonucieotidiques d6crites ci-dessus, peuvent etre 
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marques, si desire, en incorporant un marqueur detectable par des 
moyens spectroscopiques. photochimiques, biochimiques, 
immunochimiques ou encore chimiques. 

Par exemple, de tels marqueurs peuvent consister en des 
5 isotopes radioactifs ( 32 P, 33 P, , 3 H, 35 S, ), des molecules fluorescentes (5- 
bromodeoxyuridine, fluoresced , acetylaminofluorene, digoxig6nine) ou 
encore des ligands tels que la biotine. 

Le marquage des sondes est fait de preference par incorporation 
de molecules marquees au sein des polynucleotides par extension 
io d'amorces, ou bien par rajout sur les extremes 5* ou 3* 

Des exemples de marquage nqn radioactifs de fragments d'acides 
nucteiques sont decrits notamment dans le brevet frangais n° FR 78 109 
75 ou encore dans les articles de URDEA et al. (1988) ou SANCHEZ- 
PESCADOR et al. (1988). 
15 De maniere avantageuse, les sondes selon I'invention peuvent 

avoir des caracteristiques structurelles de nature a permettre une 
amplification du signal, telles que les sondes d6crites par URDEA et ai. 
(1991) ou encore dans le brevet europeen n° EP-0 225 807 (CHIRON). 
Les sondes oligonucleotides selon Invention peuvent §tre 
20 utilisees notamment dans des hybridations de type Southern a I'ADN 
genomique ou encore dans des hybridations a TARN messager 
correspondant lorsque 1'expression du transcrit correspondant est 
recherchee dans un echantillon. 

Les sondes selon I'invention peuvent aussi Stre utilis6es pour la 
25 detection de produits d'amplification PCR ou encore pour la detection de 
mesappariements. 

Des sondes ou amorces nucleotidiques selon Hnvention peuvent 
etre immobilis6es sur un support solide. De tels supports solides sont 
bien connus de ITiomme du metier et comprennent des surfaces des 
30 puits de plaques de miqrotitration, des lits de polystyrene, des lits 
magnetiques. des bandes de nitrocellulose, ou encore des 
microparticules telles que des particules de latex. 

En consequence, la presente invention concerne egalement un 
procede de detection de la presence d'un acide nucleique tel que decrit 
35 ci-avant dans un echantillon, ladite methode comprenant les Stapes de : 
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1) mettre en contact une ou plusieurs sondes nucteotidiques selon 
I'invention avec I'echantillon a tester ; 

2) detecter le complexe eventuellement forme entre la ou l.es 
sondes et Tacide nucieique present dans I'echantillon. 

5 

Selon un mode de realisation particulier du procede de detection 
selon Tinvention, la ou les sondes oligonucleotidiques sont immobilisees 
sur un support. 

Selon un autre aspect, les sondes oligonucleotidiques 
10 comprennent un marqueur detectable. 

L'invention concerne en outre un necessaire ou kit pour la 
detection de la presence d'un acide nucteique selon Tinvention dans un 
6chantillon ( ledit necessajre comprenant ; 

a) une ou plusieurs sondes nuclSotidiques telles que decrites ci- 
15 dessus ; 

b) le cas echeant, les reactifs n6cessaires d la reaction 
d'hybridation. 

Selon un premier aspect, le n6cessaire ou kit de detection est 
20 caracteris6 en ce que la ou les sondes sont immobilisees sur un support. 

Selon un second aspect, le n6cessaire ou kit de detection est 
caract6ris6 en ce que les sondes oligonucleotidiques comprennent un 
marqueur detectable. 

Selon un mode de realisation particulier du kit de detection decrit 
25 ci-dessus, un tel kit comprendra une plurality de sondes 
oligonucleotidiques conformes a l'invention qui pourront etre utilisees 
pour detecter des sequences cibles d'interSt ou alternativement detecter 
des mutations dans les regions codantes ou les regions non codantes 
des acides nucleiques selon l'invention, plus particulierement des acides 
30 nucleiques de sequences SEQ ID N°1 6 SEQ ID N°81 ou les acides 
nucteiques de sequence complementaire. • 

Des sondes pr6f6r6es comprendraient tout ou partie des 
polynucleotides de sequences SEQ ID N°82 d SEQ ID N°101. 

Ainsi, les sondes selon Tinvention immobilisees sur un support 
35 peuvent etre ordonnees en matrices telles que les " puces a ADN M . De 
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telles matrices ordonnees ont ete en particulier decrites dans le brevet 
US N° 5,143,854, dans les demandes PCT N° WO 90/150 70 et 
92/10092. 

Des matrices supports sur lesquelles des sondes 
5 oligonucteotidiques ont ete immobilis£es a une haute densit£ sont par 
exemple decrites dans les brevets US N o 5,412,087 et dans la demande 
PCT N°WO 95/11995. 

Les amorces nucleotidiques selon ('invention peuvent etre 
utilisees pour amplifier Tun quelconque des acides nucleiques selon 
io I'invention, et plus particulterement tout ou partie d'un acide nucleique de 
sequences SEQ ID N°1 a SEQ ID N°81, ou encore un variant de celui-ci. 

Un autre objet de Invention concerne un procede pour 
('amplification d'un acide nucleique selon I'invention, et plus 
particulierement un acide nucleique de sequences SEQ ID N°1 a SEQ ID 
1 5 N°81 ou un fragment ou un variant de celui-ci contenu dans un 
chantillon, ledit procede comprenant les etapes de : 

a) mettre en contact I'Schantillon dans lequel la presence de 
I'acide nucleique cible est suspectee avec une paire d'amorces 
nucleotidiques dont la position d'hybridation est localisee respectivement 

20 du cote 5' et du cote 3' de la region de I'acide nucleique cible dont 
I'amplification est recherchee, en presence des reactifs necessaires a la 
reaction d'amplification ; et 

b) detection des acides nucleiques amplifies. 

25 Pour mettre en oeuvre le procede d'amplification tel que d6fini ci- 

dessus, on aura avantageusement recours a Tune quelconque des 
amorces nucleotidiques decrites ci-avant. 

Uinvention a en outre pour objet un necessaire ou kit pour 
['amplification d'un acide nucleique selon I'invention, et plus 

30 particulierement tout ou partie d'un acide nucleique de sequences SEQ 
ID N°1 a SEQ ID N°81, ledit necessaire ou kit comprenant : 

a) un couple d'amorces nucleotidiques conformes a I'invention, 
dont la position d'hybridation est localisee respectivement du c6te 5' et 
du cote 3' de I'acide nucleique cible dont i'amplification est recherchee ; 
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b) le cas echeant, les rSactifs necessaires a la reaction 
d'amplification. 

Un tel n6cessaire ou kit d'amplification comprendra 
5 avantageusement au moins une paire d'amorces nucl6otidiques telles 
que d£crites ci-dessus. 

Vecteurs recombinants 

L'invention est egalement relative a un vecteur recombinant 
io comprenant un acide nucl6ique selon Invention. 

Avantageusement, un tel vecteur recombinant comprendra un 
acide nucleique choisi parmi les acides nucleiques suivants ; 

a) un acide nucleique codant pour une proteine ayant une 
sequence en acides amines choisie dans le groupe des sequences SEQ 

15 ID N°129 £ SEQ ID N°160 ou un fragment peptidique ou un variant de 
cette derniere ; 

b) un acide nucleique comprenant un polynucleotide choisi dans 
le groupe constitue des sequences SEQ ID N°1 £ SEQ ID N°81, ou un 
fragment ou un variant de ce dernier ; 

20 c) un acide nucl&que ayant au moins 80% d'identite en 

nucleotides avec un acide nucteique choisi dans le groupe constitu§ des 
sequences SEQ ID N°1 a SEQ ID N°81 ou un fragment ou un variant de 
ce dernier ; 

d) un acide nucleique hybridant, dans des conditions d'hybridation 
25 de forte stringence, avec un acide nucleique de sequences SEQ ID N°1 
a SEQ ID N°81, ou un fragment ou un variant de ce dernier. 

Par u vecteur " au sens de la presente invention on entendra une 
molecule d'ADN ou d'ARN circulaire ou lineaire qui est indifferemment 
30 sous forme de simple brin ou double brin. 

Selon un premier mode de realisation, un vecteur recombinant 
selon I'invention est utilise afin d'arhplifier Tacide nucleique qui y est 
insere apres transformation ou transfection de I'hdte cellulaire desire. 

Selon un second mode de realisation, il s'agit de vecteurs 
35 d'expression comprenant, outre un acide nucleique conforme a 
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1'invention, des sequences regulatrices permettant d'en dinger la 
transcription et/ou la traduction. 

Selon un mode de realisation avantageux, un vecteur recombinant 
selon I'invention comprendra notamment les elements suivants : 
5 (1) des elements de regulation de ('expression de I'acide 

nucleique a inserer, tels que des promoteurs et des enhanceurs ; 

(2) la sequence codante comprise dans I'acide nucieique 
conforme a 1'invention a insurer dans un tel vecteur, ladite sequence 
codante etant placee en phase avec les signaux de regulation d6crits 

to aux(1);et 

(3) des sequences d'initiation et d'arret de la transcription 
approprtees. 

En outre, les vecteurs recombinants selon I'invention pourront 
15 inclure une ou plusieurs origines de replication chez les h6tes cellulaires 
dans lesquels leur amplification ou leur expression est recherch6e, des 
marqueurs ou des marqueurs de selection. 

A titre d'exemples, les promoteurs bact6riens pourront etre les 
promoteurs Lad, LacZ, les promoteurs de TARN polymerase du 
20 bacteriophage T3 ou T7, les promoteurs PR, ou PL du phage lambda. 

Les promoteurs pour cellules eucaryotes comprendront le 
promoteur de la thymidine kinase du virus HSV ou encore le promoteur 
de la metallothioneine-L de souris. 

De maniere generate, pour le choix d'un promoteur adapte, 
25 rhomme du metier pourra avantageusement se r6f6rer a Touvrage de 
SAMBROOK et al. (1989) precite ou encore aux techniques d£crites par 
FULLER etal. (1996). 

Les vecteurs bacteriens pr^feres selon Tinvention sont par 
exemple les vecteurs pBR322(ATCC37017) ou encore des vecteurs tels 
30 que pAA223-3 (Pharmacia, Uppsala, Suede), et pGEM1 (Promega 
Biotech, Madison, Wl, ETATS-UNIS). 

On peut encore citer d'autres vecteurs commercialises tels que 
les vecteurs pQE70, pQE60, pQE9 (Qiagen), psiX174, pBluescript SA, 
pNH8A, pNH16A, pNH18A, pNH46A, pWLNEO, pSV2CAT, pOG44, 
35 pXTI. pSG(Stratagene). 
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II peut s'agir egalement de vecteurs de type baculovirus tel que le 
vecteur pVL 1392/1 393 (Pharmingen) utilise pour transferer les cellules 
de la Iign6e Sf9 (ATCC N°CRL 1711) deriv6es de Spodoptera 
frugiperda. 

s II peut encore s'agir de vecteurs adenoviraux tels que I'adenovirus 

humain de type 2 ou 5. 

Un vecteur recombinant selon I'invention peut aussi 6tre un 

vecteur retroviral ou encore un vecteur adeno-associe (AAV). De tels 

vecteurs adeno-associes sont par exemple d6crits par FLOTTE et al. 
10 (1992), SAMULSKI et al. (1989), ou encore McLAUGHLIN BA et al. 

(1996), 

Cellules botes recombinantes 

1 5 ^invention concerne aussi une cellule h6te recombinante 

comprenant un acide nucleique conforme a I'invention, et plus 
particulierement un acide nucleique de sequences SEQ ID N°1 d SEQ ID 
N°81 ou encore un acide nucleique comprenant tout ou partie de la 
region codante de ces derniers. 

20 Selon un autre aspect, I'invention est 6galement relative a une 

cellule hote recombinante comprenant un vecteur recombinant tel que ci- 
dessus decrit. 

Les cellules holes preferees selon ('invention sont par exemple les 
suivantes : 

25 

a) cellules hotes procaryotes: souches ^Escherichia coli (souche 
DH5-a), de Bacillus subtilis, de Salmonella typhimurium, ou encore des 
souches d'especes telles que Pseudomonas, Streptomyces et 
Staphylococus ; 

30 

b) cellules hfites eucaryotes: cellules HeLa (ATCC N°CCL2), 
cellules Cv 1 (ATCC N°CCL70), cellules COS (ATCC N°CRL 1650), 
cellules Sf-9 (ATCC N°CRL 1711), cellules CHO (ATCC N°CCL-61) ou 
encore cellules 3T3 (ATCC N°CRL-6361). 

35 
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Selon un autre aspect, invention concerne un polypeptide 
comprenant une sequence en acides amines choisie dans le groupe 
constitue des peptides de sequences SEQ ID N°129 a SEQ ID N°160, 
ou un fragment peptidique ou un variant de ce dernier. 
5 L'invention concerne aussi un polypeptide comprenant au moins 

15 acides amines consecutifs d'une sequence en acides amines choisie 
dans le groupe constitue des peptides de sequences SEQ ID N°129 a 
SEQ ID N°160, ou un fragment peptidique ou un variant de ce dernier 

L'invention est egalement relative a un polypeptide comprenant 
10 une sequence en acides amines ayant au moins 80% d'identite en 
acides amines avec une sequence en acides amines choisie dans le 
groupe constitue des peptides de sequences SEQ ID N°129 d SEQ ID 
N°160, ou un fragment peptidique ou un variant de ce dernier. 

Avantageusement, fait partie de l'invention un polypeptide ayant 
15 au moins 85%, 90%, 95% ou 99% d'identite en acides amines avec une 
sequence en acides amines choisie dans le groupe constitue des 
peptides de sequences SEQ ID N°129 a SEQ ID N°160. ou un fragment 
peptidique ou un variant de ce dernier. 

20 De preference, des polypeptides selon ('invention auront une 

longueur de 15, 18 ou 20 a 25, 35, 40, 50, 70, 80, 100 ou 200 acides 
amines consecutifs d'un acide nucleique selon l'invention, en particulier 
un polypeptide de sequence en acides amines choisie parmi les 
sequences SEQ ID N°129 a SEQ ID N°160 . 

25 

Alternativement, un polypeptide selon l'invention consistera et/ou 
comprendra les fragments. d'une longueur de 15, 18, 20, 25, 35, 40, 50, 
100 ou 200 acides amines consecutifs d'un polypeptide selon l'invention, 
plus particulierement d'un polypeptide choisi parmi les sequences SEQ 
30 IDN°129aSEQIDN°160. 

De maniere generate, les polypeptides selon la presente invention 
se presentent sous une forme isolee ou purifiee. 
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L'invention concerne aussi un polypeptide comprenant des 
modifications decides amines de 1, 2, 3, 4, 5, 10 £ 20 substitutions, 
additions ou delations d'un acide amine par rapport a la sequence en 
acjdes amines d'un polypeptide de sequences SEQ ID N°129 a SEQ ID 
5 N°160, ou encore d'un fragment ou d'un variant de ce dernier. 

L'invention est egalement relative a un proc6de pour la production 
de Tun des polypeptides de sequences SEQ ID N°129 a SEQ ID N°160 
ou d'un fragment peptidique ou d'un variant de ce dernier, ladite 
methode comprenant les etapes de : 
io a) insurer un acide nucleique codant pour ledit polypeptide dans 

un vecteur appropri6 ; 

b) cultiver, dans un milieu de culture approprie, une cellule hote 
prealablement transformee ou transfecter avec le vecteur recombinant 
de I'etape a) ; 

15 c) r6cuperer le milieu de culture conditionne ou lyser la cellule 

hote, par exemple par sonication ou par choc osmotique ; 

d) separer et purifier a partir dudit milieu de culture ou encore a 
partir des lysats cellulaires obtenus d l'6tape c), ledit polypeptide ; 

e) le cas 6cheant, caracteriser le polypeptide recombinant produit. 

20 

Les peptides selon Tinvention peuvent §tre caract6ris6s par • 
fixation sur une colonne de chromatographie d'immunoaffinit6 sur 
laquelle les anticorps diriges contre ce polypeptide ou contre un 
fragment ou un variant de ce dernier ont 6t6 prealablement immobilises. 

25 Selon un autre aspect, un polypeptide recombinant selon 

invention peut etre purifiS par passage sur une serie approprtee de 
colonnes de chromatographie, selon les methodes connues de Thomme 
de Tart et decrites par exemple dans F.Ausubel et al (1999). 

Un polypeptide selon l'invention peut etre 6galement prepare par 

30 les techniques classiques de synthese chimique indifferemment en 
solution homogene ou phase solide. 

A titre illustratif, un polypeptide selon l'invention pourra etre 
prepare par la technique ou en solution homogdne decrite par 
HOUBENWEYL (1974) ou encore la technique de synthese en phase 

35 solide decrite par MERRIFIELD (1965a; 1965b). 
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Font egalement partie de I'invention des polypeptides dits 
" homologues " a I'un quelconque des polypeptides de sequences 
d'acides amines SEQ ID N°129 a SEQ ID N°160, ou de leurs fragments 
ou variants. 

5 De tels polypeptides homologues ont des sequences d'acides 

amines possfedant une ou plusieurs substitutions d'un acide amine par 
un acide amine equivalent, par rapport aux polypeptides de reference. 

On entendra par acide amine equivalent selon la pr6sente 
invention, par exemple remplacement d'un residu sous la forme L par un 

io residu sous la forme D ou encore le remplacement d'un acide 
glutamique (E) par un acide pyro-glutamique selon des techniques bien 
connues de I'homme du metier. A titre illustratif, la synthese de peptide 
contenant au moins un r6sidu sous la forme D est decrite par KOCH 
(1977). 

is Selon un autre aspect, sont egalement considers comme des 

acides amines equivalents deux acides amines appartenant d la m§me 

classe. c'est-a-dire deux acides amines acide, basique, non polaire ou 

encore polaire non charge. 

Font egalement partis de I'invention des polypeptides comprenant 
20 au moins une liaison non peptidique telle qu'une liaison retro-inverso 

(NHCO), une liaison carba (CH 2 CH 2 ) ou encore une liaison 

cetomethylene (CO-CH 2 ). 

De preference, les polypeptides selon Tinvention comprenant une 

ou plusieurs additions, deletions, substitutions d'au moins un acide 
25 amine conserveront leur capacite a etre reconnus par des anticorps 

diriges centre les polypeptides non modifies. 

Anticorps 

30 

Les polypeptides selon Tinvention, en particulier les polypeptides 
de sequences en acides amines SEQ ID N°129 a SEQ ID N°160 ou les 
fragments et les variants de ces derniers ainsi que les peptides 
homologues peuvent etre utilises pour la preparation d'anticorps. 

35 
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Par " anticorps " au sens de la presente invention, on entendra 
notamment des anticorps polyclonaux ou monoclonaux ou des 
fragments (par exemple les fragments F (ab) 2, Fab) ou encore tout 
polypeptide comprenant un domaine de I'anticorps initial reconnaissant 
5 le polypeptide ou le fragment de polypeptide cible selon I'invention . 

Des anticorps monoclonaux peuvent etre prepares a partir 
d'hybridomes selon la technique decrite par KOHLER et MILSTEIN 
(1975). 

10 La presente invention concerne egalement des anticorps dirig6s 

contre un polypeptide tel que dealt ci-dessus ou un fragment ou un 
variant de ce dernier, tels que produits dans la technique du trioma ou 
encore la technique d'hybridome decrite par KOZBOR et al. (1983). 

1 5 ^invention a egalement trait £ des fragments d'anticorps simple 

chame Fv (ScFv) tels que decrits dans le brevet US N° 4,946,778 ou 
encore par MARTI NEAU et al. (1998). 

Les anticorps selon Tinvention comprennent 6galement des 
fragments d'anticorps obtenus a I'aide de banques de phages RIDDER 

20 et al., (1995) ou encore des anticorps humanises REIMANN et al. 
(1997); LEGERetaL, (1997). 

Les preparations d'anticorps selon I'invention sont utiles dans des 
tests de detection immunologiques destines a ('identification de la 
presence et/ou de la quantite d'antigenes presents dans un 6chantillon. 

25 Un anticorps selon ('invention pourra comprendre en outre un 

marqueur detectable isotopique ou non-isotopique, par exemple 
fluorescent ou encore etre couple £ une molecule telle que la biotine, 
selon des techniques bien connues de Thomme du metier. 

Ainsi, la mention a en outre pour objet un procede pour detecter la 

30 presence d'un polypeptide conforme £ I'invention dans un echantillon, 
ledit procede comprenant les stapes de : 

a) mettre en contact Techantillon a tester avec un anticorps tel que 
decrit ci-dessus ; 

b) detecter le complexe antigene/anticorps form§. 



35 
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L'invention est egalement relative a un necessaire ou kit de 
diagnostic ou pour la detection de la pr6sence d'un polypeptide 
conforme a invention dans un echantillon, ledit n£cessaire comprenant : 

a) un anticorps tel que defini ci-dessus ; 
5 b) un reactif permettant ia detection des complexes 

antigene/anticorps formes. 

Methode de criblage d'une molecule ou d'une substance se fixant 
sur un polypeptide selon l f invention. 
io Un polypeptide selon l'invention peut etre utilis6 pour cribler des 

molecules se fixant sur celui-ci. 

La fixation du polypeptide avec la molecule ou substance peut 
activer (molecule agoniste) ou inhiber (molecule antagoniste) I'activite 
dudit polypeptide. 

is De telles molecules capables de se fixer sur Tun quelconque des 

polypeptides selon l'invention comprennent des anticorps, des 
oligonucleotides, d'autres proteines et de maniere generate des petites 
molecules de toutes natures. 

Dans un tel test de criblage, on peut simplement mettre en 

20 Evidence la fixation de fa molecule candidate aux polypeptides, Tun des 
deux partenaires etant marqu6 par un compose detectable (polypeptide 
d'interet ou molecule candidate), la visualisation du complexe 
polypeptide/molecule candidate etant alors visualisSe par detection du 
marqueur detectable, apres elimination des molecules candidates non 

25 Itees specifiquement. 

A titre d'exemple, un test de criblage d'une motecule candidate 
capable de se fixer sur un polypeptide selon invention pourra 
comprendre avantageusement une premiere 6tape au cours de laquelle 
le polypeptide d*interet ou la molecule candidate est immobilise sur un 

30 support, une seconde etape au cours de laquelle le second partenaire 
(molecule candidate ou polypeptide d'interet) est mis en presence du 
premier compose prealablement immobilisS sur le support, une troisieme 
etape au cours de laquelle un ou plusieurs lavages sont effectu6s dans 
des conditions approprtees a I'elimination des composes n'etant pas lies 

35 specifiquement, et enfin une quatrieme etape au cours de laquelle le 
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complexe eventuellement forme entre le polypeptide d'interfit et la 
molecule candidate est detecte. 

Dans le mode de realisation du test de criblage selon lequel.la 
molecule candidate est prealablement immobiIis6e sur un support, puis 
5 mise en presence du polypeptide d'int6r§t selon Tinvention, la detection 
du complexe forme par la molecule candidate et le polypeptide d'int6r§t 
selon Tinvention pourra etre avantageusement realisee a Taide d'un 
anticorps tel que decrit ci-dessus. 

Dans un autre mode de realisation du test de criblage selon lequel 
10 c'est le polypeptide d'interet selon I'invention qui est prealablement 

immobilise sur un support, la molecule candidate sera avantageusement 
marquee a Taide d'un marqueur detectable prealablement a sa mise en 
contact avec le polypeptide d'interet immobilise. 

Un tel marqueur detectable peut etre radioactif ou non radioactif, 
15 par exemple fluorescent ou corresponds a un ligand pour un troisieme 
partenaire utilise pour la detection comme une molecule de biotine. 

En consequence, Tinvention a 6galement pour objet un proc6de 
de criblage d'une molecule ou d'une substance candidate interagissant 
20 avec un polypeptide selon I'invention, ladite methode comprenant les 
etapes de : 

a) mettre en contact un polypeptide conforme & Tinvention avec la 
substance ou molecule candidate a tester ; 

b) detecter les complexes eventuellement formes entre ledit 
25 polypeptide et ladite substance ou molecule candidate. 

L'invention concerne egalement un necessaire ou kit pour le 
criblage d'une molecule ou d'une substance candidate interagissant 
avec un polypeptide selon Tinvention, ledit necessaire comprenant : 
30 a) un polypeptide conforme £ Tinvention ; 

b) le cas 6ch6ant, des moyens necessaires a la detection du 
complexe forme entre ledit polypeptide et la molecule ou substance 
candidate. 
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La presente invention est en outre illustree, sans pour autant etre 
limitee, par les exemples suivants : 

EXEMPLES 

5 

Exemple 1: Distribution tissulaire des transcrits selon I'invention 

Le profil d'expression des polynucleotides selon la pr6sente 
invention est determine selon les protocoles d'analyse de Northern blot 
io et de transcription inverse coupl6e a la PCR d6crits notamment par 
Sambrook et al (ref. CSH Sambrook, J., Fritsch, E.F., and Maniatis, T. 
(1989). " Molecular Cloning : A Laboratory Manual, " 2 nd ed., Cold Spring 
Harbor Laboratory Press, Cold Spring Harbor, NY.). 

is Par exemple, dans le cas d'une analyse par transcription inverse, 

un couple d'amorces synthetisees a partir de I'une quelconque des 
sequences nucleotidiques des transcrits SEQ ID N°1 a SEQ ID N°81 est 
utilise pour detecter I'ADNc correspondant. 

20 La reaction de polymerase en chame (PCR) est realis6e sur des 

matrices d'ADNc correspondant a des ARNm polyA* (Clontech) 
retrotranscrits. La transcription inverse en ADNc est realisee avec 
I'enzyme SUPERSCRIPT II (GibcoBRL, Life Technologies) selon les 
conditions decrites par le fabricant. 

25 La reaction de polymerase en chaine est realisee selon des 

conditions standard, dans 20 pi de melange reactionnel avec 25 ng de la 
preparation d'ADNc. Le melange reactionnel est compose de 400 pM de 
chacun des dNTP, de 2 unites de Thermus aquaticus (Taq) ADN 
polymerase (Ampli Taq Gold ; Perkin Elmer), de 0,5 pM de chaque 

30 amorce, de 2,5 mM MgCI2, et de tampon PCR. Trente quatre cycles de 
PCR ( denaturation 30 s a 94 °C, hybridation de 30 s decompose 
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comme suit lors des 34 cycles : 64°C 2 cycles, 61 °C 2 cycles, 58°C 2 
cycles et 55°C 28 cycles et une elongation d'une minute par kilobase a 
72°C) sont realises apres une premiere etape de denaturation d 94°C 
durant 10 min dans un thermocycler Perkin Elmer 9700. Les reactions 
5 de PCR sont visualisees sur gel d'agarose par electrophor&se. Les 
fragments d'ADNc obtenus peuvent etre utilises comme sondes pour 
une analyse par Northern blot et peuvent egalement etre utilises pour la 
determination exacte de la s6quence polynucleotidique. 

io Dans le cas d'une analyse par Northern Blot, une sonde d'ADNc 

produite comme d6crit ci-dessus est marquee au 32 P grace au systeme 
de marquage d'ADN High Prime (Boehringer) selon les instructions 
indiquees par le fabricant. Apres marquage, la sonde est purifi6e sur une 
microcolonne de Sephadex G50 (Pharmacia) selon les instructions 

15 indiquees par le fabricant. La sonde marquee et purifiee est alors utilis6e 
pour la detection de ('expression des ARNm dans diff§rents tissus. 

Le Northern blot contenant des echantillons d'ARN de differents 
tissus humains ((Multiple Tissue Northern , MTN, Clontech) Blot 2, 
reference 77759-1) est hybride avec la sonde marquee. 

20 . Le protocole suivi pour les hybridations et lavages peut §tre soit 

directement celui dScrit par le fabricant (Manuel d'utilisation PT1200-1) 
soit une adatation de ce protocole en utilisant les m6thodes connues de 
f Thomme de Tart et decrites par exemple dans F.AUSUBEL et al (1 999). 
On pourra ainsi faire varier par exemple les temperatures de 

25 prehybridation et d'hybridation en presence de formamide. 

Par exemple on pourra utiliser le protocole suivant : 
1- Competition des membranes et pre-hvbridation : 

30 

- M6langer : 40pl ADN sperme de saumon (10mg/ml) 
+ 40 pi ADN placentaire humain (10mg/ml) 
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- Denaturer 5 mn a 96 C C, puis plonger dans la glace le melange. 

• Oter le SSC 2X et verser 4 ml de mix formamide dans le tube 
5 d'hybridation contenant les membranes. 

- Ajouter le melange des deux ADN d6natur6s. 

- Incubation a 42°C pendant 5^6 heures, avec rotation. 
2- Competition de la sonde marquee : 

- Ajouter a la sonde marquee et puriftee 10 d 50 pi ADN Cot I, selon la 
quantity de repeats. 

15 

- D6naturer 7 £ 1 0 mn a 95°C. 

- Incuber £ 65°C pendant 2 & 5 heures. 
20 3- HYBRIDATION : 

- Oter le mix de pr6 hybridation. 

- Melanger 40 pi ADN sperme de saumon + 40 pi ADN placentaire 
25 humain ; denaturer 5 mn a 96°C, puis plonger dans la glace. 

- Ajouter dans le tube d'hybridation 4 ml de mix formamide, le melange 
des deux ADN et la sonde marquee/ADNCot I d6natur§e. 

30 - Incuber 15 a 20 heures & 42°C, avec rotation. 

4- Lavages : 

- Un lavage a temperature ambiante dans du SSC 2X, pour rincer. 

35 

• 2 fois 5 minutes a temperature ambiante SSC 2X et SDS 0,1% & 65°C. 

- 2 fois 15 minutes a 65°C SSC 1X et SDS 0,1% 6 65°C. 

40 

Apres hybridation et lavage, le blot est analyse apr6s une. nuit 
deposition au contact d'un 6cran au phosphore r§vele a I'aide du Storm 
(Molecular Dynamics, Sunnyvale, CA). 
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Exemple 2 : Obtention de fragments d'ADNc complets 
correspondantaux transcrits selon Tinvention 

- Differentes approches peuvent §tre utilisees pour isoler I'ADNc 
5 correspondant £ un des clones particulier parmi les sequences SEQ ID 
N° 1 a SEQ ID N°81. 

Par exemple un clone complet peut etre directement isole par 
hybridation en criblant une banque d'ADNc au moyen d'une sonde 
polynucleotidique sp6cifique de la sequence du gene d'interfet. 
io En particulier une sonde specifique de 30-40 nucleotides est 

synth6tisee en utilisant un synth6tiseur de marque Applied 
Biosystem/Perkin Elmer selon la sequence choisie. 

L'oligonucleotide obtenu est radiomarqu6 ( par exemple au 32 P-y- 
ATP en utilisant la T4 polynucleotide kinase et est purifi6 selon les 
is methodes usuelles (e.g. Maniatis et al. Molecular cloning : A Laboratory 
Manual, Cold Spring Harbor Press, Cold Spring, NY 1982 ou encore 
F.Ausubel et al . (Current Protocols in Molecular Biology, J.Wiley and 
Sons Eds, 1999). 

20 La banque de clones contenant I'ADNc que Ton veut cribler est 

6talee sur milieu de culture en bolte de P6tri (1.5% agar) contenant les 
antibiotiques approprtes selon les methodes usuelles cities ci dessus 
(F.Ausubel et al.). Les colonies ainsi produites apres incubation sont 
transferees sur filtres de nitrocellulose et cribl6es au moyen de la sonde 

25 nucleotidique radiomarqu6e, selon les methodes usuelles et les colonies 
hybridant avec la sonde sont isol6es et sous donees. 

L'ADN des clones ainsi repere est prepare et analyse par 
sequengage. Les clones contenant les fragments correspondant a 
30 I'ADNc complet sont purifies et reclones dans, le vecteur pcDNA3 selon 
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les protocoles connus de rhomme de Tart et presentes par exempie 
dans F.Ausubel et al (1999) . 

Differentes methodes sont connues pour identifier les extr6mit6s 
5 5' et 3' du cDNA correspondant aux genes decrits dans la presente 
demande. Ces methodes incluent mais ne se limitent pa's au clonage par 
hybridation, au clonage utilisant des protocoles similaires ou identiques a 
la 3' ou 5* RACE-PCR (Rapid Amplification of cDNA End-PCR) qui sont 
bien connues de I'homme de Tart 

10 

Par exempie, on pourra utiliser le kit commercialise par la societe 
Clontech (Marathon Ready™ cDNA kit , protocole ref6renc6 PT1 156-1) 
ou alternativement une methode similaire a la 5'RACE est disponible 
pour caracteriser I'extremite 5' manquante d'un cDNA (Fromont-Racine 

15 et al. Nucleic Acid Res.21(7) :1683-1684 (1993)). En bref, un 
oligonucleotide d'ARN est ligature a I'extremite 5' d'une population 
d'ARNm. Apr6s . retrotranscription en cDNA, un jeu d'amorces 
specifiques respectivement de Tadaptateur ligature en 5' et d'une 
sequence situee en 3 1 du gene d^nterSt est utilise en PCR pour amplifier 

20 la portion 5 1 du cDNA recherch§. Le fragment amplifte est ensuite utilise 
pour reconstruire I'ADNc complet. 



Exempie 3 : Analyse du profil d'expression genlque pour la maladie 
25 de Tangier 

La verification de la perte d'expression du gene candidat 
entrainant le phenotype cellulaire de Tangier peut-etre determine par 
hydridation de ces sequences avec des sondes correspondant aux 
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ARNm provenant de fibroblastes de sujets atteints ou non de la maladie, 
selon ies methodes decrites ci-dessous : 

1. Preparation des ARN totaux. des ARNm ooMA)* et de sondes de 
5 cDNA 

Les ARN totaux sont obtenus £ partir de cultures cellulaires des 
fibroblastes de sujets normaux ou bien atteints de la maladie de Tangier 
par la mfethode a I'isothiocyanate de guanidine(Chomczynski & Sacchi, 
1987). Les ARNm po!y(A) 4 sont obtenus par chromatographie d'affinite 
io sur colonnes d'oligo(dT)-cellulose (Sambrook et al., 1989) et les cDNA 
utilises comme sondes sont obtenus par RT-PCR (DeRisi et al., 1997) 
avec des oligonucleotides marques avec un produit fluorescent 
(Amersham Pharmacia Biotech ; CyDye™). 

15 2. Hvdridation et detection des niveaux d'expressions 

Les membranes de verre contenant les sequences pr6sentees 
dans cette demande de brevet, correspondant au gene Tangier sont 
hydridees avec les sondes de cDNA, obtenues a partir des fibroblastes 
20 (Iyer et al., 1999). ^utilisation du systeme Amersham/molecular 
Dynamics (Avalanche Microscanner™) permet la quantification des 
expressions des produits de sequences sur le type cellulaire sain ou 
affecte. 

25 Exemple 4 : Construction du vecteur d'expression dans des 
cellules de mammiferes 

Le gene d'interet peut etre exprime dans des cellules de 
mammiferes. Un vecteur d'expression eukaryote typique contient un 
30 promoteur qui permet I'initiation de la transcription de I'ARNm, une 
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sequence codant pour la proteine, et les signaux requis pour la 
terminaison de la transcription et pour la polyadenylation du transcrit. II 
contient aussi des signaux supplementaires comme des enhancers, .la 
sequence (de) Kozak et des sequences necessaires pour l'6pissage de 
5 I'ARNm. Une transcription efficace est obtenue avec les Elements early 
et late des promoteurs du virus SV40, les LTR retroviraux ou le 
promoteur early du virus CMV. Cependant des 6l6ments cellulaires 
comme le promoteur de I'actine peuvent aussi §tre employes. De 
nombreux vecteurs depression peuvent etre employ6s pour mettre en 
io oeuvre la presente invention comme le vecteur pcDNA3. 

Exemple 5 : Production des polypeptides 

Le polypeptide correspondant au transcrit partiel du g6ne GS 
is N°XX ou au cDNA complet decrit dans I* Exemple 2 (clonage du cDNA 
complet) peut etre facilement produit dans un systeme d'expression 
bacterienne, de cellules d'insectes en utilisant les vecteurs baculovirus 
ou encore dans des cellules de mammiferes avec ou sans les vecteurs 
du virus de la vaccine. Toutes les methodes sont aujourd'hui largement 
20 d6crites et connues de I'homme de I'art. On en trouvera par exemple 
une description detaill&e dans F.Ausubel etal. (1999). 

Exemple 6 : Production d'un anticorps derive d'un polypeptide 

25 

Les anticorps dans la presente invention peuvent etre prepares 
par differentes methodes (Current Protocols In Molecular Biology 
Volume 1 edited by Frederick M. Ausubel, Roger Brent, Robert E. 
Kingston, David D. Moore, J.G. Seidman, John A. Smith, Kevin Struhl - 
30 Massachusetts General Hospital Harvard Medical School, chapitre 11). 
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Par exemple, les cellules exprimant un polypeptide de la presente 
invention sont injectees dans un animal afin d'induire la production de 
serum contenant les anticorps. Dans une des m6thodes d6crites, les 
proteines sont preparees et purifiees afin d'eviter des contaminations. 
5 Une telle preparation est alors introduite dans 1'animal dans le but de 
produire des antisera polyclonaux de plus grande activite. 

Dans la methode pref6r6e, les anticorps de la presente invention 
sont des anticorps monoclonaux. De tels anticorps monoclonaux 
peuvent etre prepares en utilisant la technique d'hybridome. (KChler et 

io al, Nature 256 :495 (1975) ; Kohleret al, Eur. J. Immunol. 6 :511 (1976) ; 
Kohler et al, Eur. J. Immunol. 6:292 (1976); Hammeling et al., in: 
Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., pp. 563- 
681 51981). En general, de telles methodes impliquent d'immuniser 
Tanimal (preferentiellement une souris) avec un polypeptide ou, mieux 

1 5 encore, avec une cellule exprimant le polypeptide. Ces cellules peuvent 
§tre mises en culture dans un milieu de culture tissulaire adequat. 
Cependant, il est preferable de cultiver les cellules dans un milieu Eagle 
(Earle modifie) supplements avec 10% de serum bovin foetal (inactive a 
56°C) et additionne d'environ 10 g /I d'acides amin6s non essentiels, de 

20 1000 U/ml de p6nicilline et d'environ 100 pg/ml de streptomycine. 

Les splenocytes de ces souris sont extraits et fusionn6s avec une 
lignee cellulaire de myelome adequate. Cependant, il est preferable 
d'utiliser la lignee cellulaire de myelome parentale (SP20) disponible a 
I'ATCC. Apres fusion; les cellules d'hybridomes resultantes sont 

25 s§lectivement maintenues en milieu HAT puis donees par dilution limite 
comme decrit par Wands et al. (Gastroenterology 80:225-232 (1981)). 
Les cellules d'hybridomes obtenues aprds une telle selection sont 
testees afin d'identifier les clones secretant des anticorps capables de se 
fixer au polypeptide. 

30 D'autre part, d*autres anticorps capables de se fixer au 

polypeptide peuvent etre produits selon une procedure en 2 etapes 
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utilisant des anticorps anti-idiotypique une telle m6thode est fondee sur 
le fait que les anticorps sont eux-memes des antig^nes et en 
consequence il est possible d'obtenir un anticorps reconnaissant un 
autre anticorps. Selon cette m§thode, les anticorps specifiques de la 
5 proteine sont utilises pour immuniser un animal, pr6f6rentiellement une 
souris. Les splenocytes de cet animal sont ensuite utilises pour produire 
des cellules hybridomes, et ces dernieres sont criblees pour identifier les 
clones qui produisent un anticorps dont la capacite a se fixer au 
complexe proteine-anticorps specifique peut-etre bloque par le 

io polypeptide. Ces anticorps peuvent 6tre utilises pour immuniser un 
animal afin d'induire la formation en plus grande quantite d'anticorps 
specifiques de la proteine. 

II serait apprecie que Fab et F(ab')2 et les autres fragments des 
anticorps de la pr6sente invention puissent dtre utilises selon les 

)5 methodes decrites ici. De tels fragments sont typiquement produits par 
clivage proteolytique a I'aide d'enzymes telles que la PapaTne (pour 
produire les fragments Fab) ou la Pepsine (pour produire les fragments 
F(ab*)2). Sinon, les fragments secretes reconnaissant la proteine 
peuvent etre produits en appliquant la technologie de I'ADN recombinant 

20 ou de la chimie de synthese. 

Pour ('utilisation in vivo d'anticorps chez I'homme il serait 
preferable d'utiliser des anticorps monoclonaux chim6riques 
" humanises De tels anticorps peuvent etre produits en utilisant des 
constructions g6n6tiques derives de cellules d'hybridomes produisant les 

25 anticorps monoclonaux decrits ci-dessus. Les methodes pour produire 
les anticorps chimeriques sont connus par I'homme de Tart. (Pour revue, 
voir : Morrison, Science 229 :1202 (1985) ; Oi et al., Biotechnique 4 :214 
(1986); Cabilly et al., US patent n°4,816,567 ; Taniguchi et aL, EP 
171496 ; Morrison et al., EP 173494 ; Neuberger et al., WO 8601533 ; 

30 Robinson et al., WO 8702671 ; Boulianne et al ; Nature 312 :643 
(1984) ; Neuberger et al., Nature 314 : 268 (1985)). 
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Exemple 7 : Correction du phenotype cellulaire de la maladie de 
Tangier 

5 

La maladie de Tangier est caracterisde par un catabolisme 
acc6lere des particules lipoproteiques de haute densite (HDL) et une 
accumulation de cholesterol dans les tissus. Notamment, les fibroblastes 
de peau des patients atteints de la maladie de Tangier ont une capacite 

io rfeduite a eliminer leur contenu en cholesterol par le processus d'efflux 
de cholesterol assure par Tapolipoproteine A-l (apoA-l) ( prot6ine majeure 
des HDL (Francis et al M 1995). Cette caracteristique correspondant & 
une perte de fonction est aussi retrouvee dans d'autres cellules 
fibroblastiques de patients atteints de deficit familial en HDL (Marcil et 

15 al M 1999). 

La correction du phenotype des fibroblastes de Tangier peutetre 
assuree par la transfection des ADNc complets correspondant aux 
sequences proposees, dans lesdites cellules. L'ADNc est insere dans un 
20 vecteur depression qui est ensuKe transfecte selon les methodes 
decrites ci-dessous : 

1. Preparation des cultures fibroblastiques de suiets normaux et de 
suiets atteints de la maladie de Tangier 

25 Les fibroblastes primaires de peau humaine sont obtenus par la 

mise en culture de biopsie de peau provenant de I'avant bras. Ces 
biopsies sont effectuees sur des patients atteints de la maladie de 
Tangier ayant les particularites cliniques et biochimiques des 
" homozygotes \ c'est a dire des amygdales oranges, des 

30 concentrations plasmatiques d'apoA-l et de cholesterol-HDL inferieur au 
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5 eme percentile. Les lignees de fibroblastes normaux sont obtenus chez 
I'American Type Culture Collection (Rockville, MD). Les fibroblastes sont 
cultiv6s dans un milieu EMMEM (Eagle-modified minimium essential 
medium; GIBCO) complete par 10% de serum de veau foetal, de la 

5 glutamine a 2 mM, 100 Ul/ml de penicilline et 100 pg/ml de steptomycine 
(milieu designe par EMMEM10). En vue de la realisation de l'6tude de 
I'efflux de cholesterol, ces cellules sont pr6-charg6es en cholesterol par 
incubation de 24 heures avec 50pg/ml de cholesterol dans le milieu 
d^crit ci-dessus sans serum de veau mais contenant 2 mg/ml d'albumine 

10 bovine (BSA, fraction V). 

2. Etude de I'efflux de cholesterol 

Les fibroblastes pre-charges en cholesterol £ confluence sur des 
plaques a 24 puits sont incubes dans le milieu EMMEM10 et 1 pCi/ml de 

15 1,2- 3 H-cholesterol (50 Ci/mmol ; Dupont ; Wilmington, DE) durant 48 
heures. Environ 100 000 coups par minute sont obtenus par puits ou 
1000 coups par minutepar pg de proteine cellulaire. Les cellules sont 
lavees trois fois avec du milieu EMMEM/BSA, et incubees avec ce milieu 
durant 24 heures avant de transfecter le gene d'int6r§t et de d6marrer 

20 I'efflux par ajout de 10 pg/ml de proteoliposome contenant I'apoA-l en 
milieu EMMEM/BSA. Ces proteoliposomes sont prepares par sonication 
de phosphatidylcholine et d'apoA-l humaine purifi6e (Jonas, 1986). La 
transfection cellulaire s'effectue par la technique de precipitation de 
phosphate de calcium (Sambrook et al., 1989). Apr6s la periode d'efflux, 

25 en general 20 heures, le milieu est collecte, centrifug§ (1000 g, 5 min), et 
la radioactivit6 determinee par comptage en scintillation liquide. La 
radioactivity r^siduelle dans les cellules est aussi determinee sur la nuit 
apres extraction des lipides dans I'isopropanol. Le pourcentage d'efflux 
est calcule en divisant la radioactivite mesuree dans le surnageant par la 

30 somme des radioactivites mesurees, dans le surnageant et I'extrait 
cellulaire. Un controle interne est realist par transfection d'un gene 
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marqueur et I'incubation sur 24 heures avec un milieu EMMEM/BSA 
sans proteoliposome contenant I'apoA-l. L'efflux de cholesterol cellulaire 
a partir de fibroblastes normaux et transfectes par une gene temoin 
correspondent a 6±2% alors que celui obtenu a partir de fibroblastes 
5 atteints de la maladie de Tangier et transfectes par ce gene temoin est 
inferieur a 1%. En revanche la transfection des fibroblastes atteints de la 
maladie de Tangier par un plasmide correspondent aux genes proposes 
dans ce dossier permettrait de restaurer la capacity de ces cellules a 
eliminer leur exces de cholesterol a un niveau correspondent 6 celui de 
I0 fibroblastes normaux. 

Exemple 8 : lsolement des clones qenomiques correspondanta un 
polynucleotide 

L'isolement des clones genomiques correspondant a un transcrit 
!5 est realise par criblage de la banque de BAC d'ADN genomique humain 
(par exemple celle fournie par Mel Simon, CalTech., ref : Kim et al. 
Genomics (1996), 34 :213-218)) par PCR avec des amorces specifiques 
de la sequence d'ADNc correspondant aux sequences des transcrits 
SEQ ID N°1£ SEQ ID N°81 selon Invention, selon la m6thode d6crite 
20 dans I'Exemple 1. 

Exemple 9 : Determination de polvmorphisme/mutation de Tun des 
genes correspondant aux transcrits selon Tinvention 

La detection de polymorphism^ et ou de mutations dans les 
25 sequences des transcrits peut etre realisee selon differents protocoles. 
La methode de choix est le s6quen9age direct. 

Dans le cas d'un transcrit ou la structure du gfene correspondant 
est inconnue ou partiellement connue il est necessaire de d6terminer 
precisement sa structure intron-exon ainsi que la sequence genomique 
30 du gene correspondant. II s'agit done dans un premier temps d^soler le 
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ou les clones de BAC d'ADN genomique correspondant au transcrit 
etudie selon la methode d6crite dans I'exemple 8, de s6quencer 1'insert 
du ou des clones correspondants et de determiner la structure intron- 
exon en comparant la sequence de I'ADNc a celle de I'ADN genomique 
5 obtenu. 

La technique de detection de mutation par s6quen9age direct 
consiste £ comparer les sequences genomiques du gene correspondant 
a I'ADNc SEQ ID N° 1 a SEQ ID N°81 obtenues a partir d'au moins 8 
individus ( 4 individus affect6s par la pathologie etudi6e et 4 individus 

10 non affectes). Les divergences de sequenceconstituent des 
polymorphismes. Tous ceux modrfiant la sequence en acides amin6s de 
la proteine sauvage sont des mutations susceptibles d'affecter la 
fonction de ladite proteine qu'il est interessant de considerer plus 
particulterement dans les etudes dissociation cas/t6moin decrite dans 

is l'Exemple8. 

Exemple 10 : Identific ation du aene causal par la mutation causale 
ou une difference transcriptionnelle 

Parmi les mutations identifies selon la mSthode d6crite dans 
20 I'Exemple 9, toutes celles associees au ph6notype malade sont 
susceptibles d'etre causales. La validation de ces resultats est faite en 
sequengant le gene chez tous les individus atteints et leurs apparent^ 
(dont I'ADN est disponible). 

D'autre part, la realisation de Northern blot ou RT-PCR, selon la 
25 methode decrite dans I'Exemple 1, a partir d'ARN specifique d'individus 
atteints et non-atteints permet de detecter des variations notables du 
niveau depression du gene 6tudie, en particulier une absence de 
transcription du gene. 
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TABLEAU I 

BREVE DESCRIPTION DES SEQUENCES SELON h' INVENTION 



N° de Sequence 


Designation 


1 


ADNc correspondent au gene GS9002S31 


2 


1 ADNc correspondant au gene GS910331 


3 


2 ADNc correspondant au gene GS910331 


4 


ADNc correspondant au gene GS9 14554 


5 


1 ADNc correspondant au gene GS914739 


6 


2e ADNc correspondant au gene GS914739 


7 


ADNc correspondant au gene GS9 15574 


8 


ADNc correspondant au gene GS930321 


9 


ADNc correspondant au gene GS931311 


10 


ADNc correspondant au geneGS934660 


11 


ADNc correspondant au gene GS938315 


12 


1 ADNc correspondant au gdne GS93953 


13 


2e ADNc correspondant au gene GS93953 


14 


1 ADNc correspondant au geneGS939874 


15 


2e ADNc correspondant au geneGS93 9874 


16 


ADNc correspondant au gdne GS911370 


17 


1 ADNc correspondant au geneGS913920 


18 


2e ADNc correspondant au geneGS913920 


19 


1 ADNc correspondant au geneGS91437 


20 


2e ADNc correspondant au geneGS91437 


21 


1 ADNc correspondant au gdne GS91507 


22 


2e ADNc correspondant au gene GS91507 


23 


1 ADNc correspondant au geneGS915231 


24 


2 ADNc correspondant au geneGS915231 


25 


1 ADNc correspondant au gene GS915528 


26 


2e ADNc correspondant au gene GS915528 


27 


1 ADNc correspondant au gene GS99817 
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TABLEAU I (suite 1) 
BREVE DESCRIPTION DES SEQUENCES SELON L' INVENTION 



5 



N° de Sequence 


Designation 


28 


2e ADNc correspondant au gene GS99817 


23 


ADNc correspondant au gene GS916229 


30 


1 ADNc correspondant au gene GS 92 54 4 


31 


2e ADNc correspondant au oene GS92544 


32 


3e ADNc correspondant au gene GS92544 


33 


1 ADNc correspondant au gene GS930284 


34 


2e ADNc correspondant au gene GS930284 


35 


ADNc correspondant au gene GS93382 


36 


ADNc correspondant au gene GS94 63 00 


37 


l ADNc correspondant au gene GS 93 73 4 5 


38 


2e ADNc correspondant au g6ne GS 93 7345 


39 


3e ADNc correspondant au gene GS937345 


40 


1 ADNc correspondant au gene GS 9 95 5 6 


41 


2e ADNc correspondant au gene GS99556 


42 


1 ADNc correspondant au gene GS96663 


43 


2e ADNc correspondant au gene GS96663 


44 


3e ADNc correspondant au gene GS96663 


45 


4e ADNc correspondant au gene GS96663 


46 


5e ADNc correspondant au gene GS96663 


47 


6e ADNc correspondant au gene GS96663 


48 


1 ADNc correspondant au gene GS941675 


49 


2e ADNc correspondant au gene GS941675 


50 


3e ADNc correspondant au gene GS941675 


51 


1 ADNc correspondant au gene GS929341 


52 


2e ADNc correspondant au gene GS929341 
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TABLEAU I (suite 2) 
BREVE DESCRIPTION DES SEQUENCES SELON L' INVENTION 



N° de Sequence 


Designation 


53" 


3e ADNc correspondant au gene GS929341 


54 


1 ADNc correspondant au gene GS915742 


55 


2e ADNc correspondant au gene GS 9 15742 


56 


3e ADNc correspondant au gene GS915742 


57 


1 ADNc correspondant au gene GS913018 


58 


2e ADNc correspondant au gene GS913018 " 


59 


3e ADNc correspondant au gene GS913018 


60 


1 ADNc correspondant au gene GS911742 


61 


2e ADNc correspondant au gene GS911742 


62 


3e ADNc correspondant au gene GS911742 


63 


1 ADNc correspondant au gene GS98601 


64 


2e ADNc correspondant au gene GS98601 


65 


3e ADNc correspondant au gene GS98601 


66 


1 ADNc correspondant au gene GS94852 


67 


2e ADNc correspondant au gene GS94852 


68 


3e ADNc correspondant au gene GS94852 


69 


1 ADNc correspondant au gene GS935135 


70 


2e ADNc correspondant au gene GS935135 


71 


3e ADNc correspondant au gene GS935135 


72 


i adnc correspondant au gene GS914669 


73 


2e ADNc correspondant au gene GS914669 


74 


3e ADNc correspondant au gene GS914669 


75 


1 ADNc correspondant au gene GS91383 9 


76 


2e ADNc correspondant au gene GS913839 


77 


3e ADNc correspondant au gene GS913839 


78 


1 ADNc correspondant au gene GS91263 9 


79 


2e ADNc correspondant au gene GS912639 
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TABLEAU I (suite 3 ) 



BREVE DESCRIPTION DES SEQUENCES SELON L' INVENTION 



N° de Sequence 


Designation 


80 


3e ADNc correspondant au gene GS912639 


81 


ADNc correspondant au gene GS933630 


82 


Sonde pour la sequence SEQ ID NO 2 


83 


Sonde pour la sequence SEQ ID NO 2 


64 


Sonde pour la sequence SEQ ID NO 4 


85 


Sonde pour la sequence SEQ ID NO 5 


86 


Sonde pour la sequence SEQ ID NO 10 


87 


Sonde pour la sequence SEQ ID NO 12 


88 


Sonde pour la sequence SEQ ID No 16 


89 


Sonde pour la sequence SEQ ID NO 16 


90 


Sonde pour la sequence SEQ ID NO 21 


91 


Sonde pour la sequence SEQ ID NO 23 


92 


Sonde pour la sequence SEQ ID NO 25 


93 


Sonde pour la sequence SEQ ID NO 27 


94 


Sonde pour la sequence SEQ ID NO 3 0 


95 


Sonde pour la sequence SEQ ID NO 33 


96 


Sonde pour la sequence SEQ ID NO 33 


97 


Sonde pour la sequence SEQ ID NO 35 


98 


Sonde pour la sequence SEQ ID NO 40 


99 


Sonde pour la sequence SEQ ID NO 40 


100 


Sonde pour la sequence SEQ ID NO 40 


101 


Sonde pour la sequence SEQ ID NO 60 


102 


Amorce dans SEQ ID NO 17 


103 


Amorce dans SEQ ID NO 17 


104 


Amorce dans SEQ ID NO 37 


105 


Amorce dans SEQ ID NO 37 


106 


Amorce dans SEQ ID NO 4 2 
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TABLEAU I (suite 4) 
BREVE DESCRIPTION DES SEQUENCES SELON L' INVENTION 



5 



N° de Sequence 


Designation ■ 1 


107 


Amorce dans SEQ ID NO 42 " 


108 


Amorce dans SEQ ID NO 43 1 


109 


Amorce dans SEQ ID NO 45 " " 1 


110 


Amorce dans SEQ ID NO 45 ~~ \ 


111 


Amorce dans SEO ID no 5*7 ~ 


112 


Amorce dans SEO id no " — " — 1 


113 




114 


Amorce dans spo t n mo c o — — — „ i 


115 


. •-• • • w a. %_ v» untiD ODy JL !■/ WW OO I 


116 


Amorce dans SEO td wn 1 


117 




118 


Amorce dans SEO in mo k7 " — 1 


119 


Amorce dans SEO in ran <To " — — 1 


120 




121 


Amorce dans SEO td mo no ~~~~ — — 


122 


Amorce dans SEQ ID NO 72 


123 


Amorce dans SEQ ID NO 73 


124 


Amorce dans SEQ ID NO 73 


125 


Amorce dans SEQ ID NO 7 5 


126 


Amorce dans SEQ ID NO 76 


127 


Amorce dans SEQ ID NO 78 


128 


Amorce dans SEQ ID NO 79 " 


129 


Polypeptide code par la sequence SEQ ID NO 6 


130 


Polypeptide code" par la sequence SEQ ID NO 9 


131 


Polypeptide code par la sequence SEQ ID NO 13 
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TABLEAU I (suite 5) 



BREVE DESCRIPTION DES SEQUENCES SELON L' INVENTION 



N° de Sequence 


Designation 


132 


Polypeptide cod6 par la sequence SEQ ID NO 15 


133 


Polypeptide code par la sequence SEQ ID NO 16 


134 


Polypeptide cod6 par la sequence SEQ ID NO 18 


135 


Polypeptide cod£ par la sequence SEQ ID NO 19 


136 


Polypeptide code par la s§quence SEQ ID NO 20 


137 


Polypeptide cod€ par la sequence SEQ ID NO 21 


138 


Polypeptide cod£ par la' sequence SEQ ID NO 22 


139 


Polypeptide cod£ par la sequence SEQ ID NO 23 


140 


Polypeptide cod£ par la sequence SEQ ID NO 24 


141 


Polypeptide cod6 par la sequence SEQ ID NO 25 


142 


Polypeptide cod€ par la sequence SEQ ID NO 26 


143 


Polypeptide code par la sequence SEQ ID N027 


144 


Polypeptide cod£ par la sequence SEQ ID NO 28 


145 


Polypeptide cod§ par la sequence SEQ ID N029 


146 


Polypeptide cod£ par la sequence SEQ ID NO 30 


147 


Polypeptide codi par la sequence SEQ ID NO 31 


148 


Polypeptide cod€ par la sequence SEQ ID NO 32 


149 


Polypeptide cod# par la sequence SEQ ID NO 33 


150 


Polypeptide cod§ par la sequence SEQ ID NO 34 


151 


Polypeptide cod§ par la sequence SEQ ID NO 35 


152 


Polypeptide cod§ par la sequence SEQ ID NO 36 


153 


Polypeptide cod§ par la sequence SEQ ID NO 37 


154 


Polypeptide cod§ par la sequence SEQ ID NO 40 


155 


Polypeptide cod6 par la sequence SEQ ID NO 47 


156 


Polypeptide code par la sequence SEQ ID NO 52. 



5 
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TABLEAU I (suite 6) 



BREVE DESCRIPTION DES SEQUENCES SELON h' INVENTION 



5 



N° -de Sequence 


Designation 


157 


Polypeptide code* par la sequence. SEQ ID NO 53 


158 


Polypeptide code* par la sequence SEQ ID NO 62 


159 


Polypeptide code* par la sequence SEQ ID NO 65 


160 


Polypeptide code par la sequence SEQ ID NO 74 
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REVINDICATIONS 

1. Acide nucleique codant pour une proteine ayant une sequence 
en acides amines choisie dans le groupe des sequences d'aminoacides 

5 SEQ ID N°129 £ SEQ ID N°160 ou un fragment peptidique ou un variant 
de cette derniere, ou un acide nucleique de sequence complementaire. 

2. Acide nucleique comprenant au moins huit nucleotides 
consecutifs d'un polynucleotide choisi dans le groupe constitu6 des 

10 sequences nucleotidiques SEQ ID N°1 & SEQ ID N°81, ou un acide 
nucleique de sequence complementaire. 

3. Acide nucleique selon la revendication 2 comprenant au moins 
vingt nucleotides consecutifs d'un polynucleotide choisi dans le groupe 

15 constitue des sequences nucleotidiques SEQ ID N°1 a SEQ ID N°81, ou 
un acide nucleique de sequence complementaire. 

4. Acide nucleique ayant au moins 80% d'identite en nucleotides 
avec un acide nucleique selon Tune quelconque des revendications 1 A 

20 3, ou un acide nucleique de sequence complementaire. 

5. Acide nucleique hybridant, dans des conditions d'hybridation de 
forte stringence, avec un acide nucleique selon Tune quelconque des 
revendications 1 a 4, ou un acide nucleique de sequence 

25 complementaire. 

6. Sonde ou amorce nucieotidique comprenant au moins huit 
nucleotides consecutifs d'un acide nucleique selon Tune quelconque des 
revendications 14 5. 

30 
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7. Sonde ou amorce nucleotidique selon la revendication 6 ayant 
une longueur de 15 a 300 nucleotides. 

8. Sonde ou amorce nucleotidique selon la revendication 6 ayant 
5 une longueur de 20 a 200 nucleotides. 

9. Sonde ou amorce nucleotidique comprenant au moins huit 
nucleotides consecutifs d'un polynucleotide choisi parmi les sequences 
SEQ ID N°82 a 101 et 102 a 128. 

io 

10. Procede pour ('amplification d'un acide nucleique selon Tune 
quelconque des revendications 1 3 5 contenu dans un echantillon, ladite 
m6thode comprenant les etapes de : 

1 5 a) mise en contact de Techantillon dans lequel la presence de 

I'acide nucleique cible est suspect6e avec une paire d'amorces 
nucleotidiques dont la position d'hybridation est localisee respectivement 
du cote 5* et du c6t6 3' de la region de I'acide nucleique cible dont 
Tamplification est recherch£e, en presence des reactifs n6cessaires a la 

20 reaction d'amplification; et 

b) detection des acides nucleiques amplifies. 

11. Proc§d6 d'amplification selon la revendication 10, caracterise 
25 en ce que les amorces nucleotidiques sont choisies parmi les amorces 

selon Tune quelconque des revendications 6 3 9. 

12. Necessaire pour Tamplification d'un acide nucleique selon 
Tune quelconque des revendications 1 a 5 comprenant : 

30 



WO 00/71710 



145 



PCT/FR00/01426 



a) un couple d'amorces nucleotidiques dont la position 
d'hybridation est localise respectivement du c6t6 5' et du cote 3' de 
I'acide nucleique cible dont I'amplification est recherch6e; 

5 b) le cas ech^ant, les reactifs nfecessaires a la reaction 

d'amplification. 

13. Necessaire pour ['amplification d'un acide nucleique selon la 
revendication 12, caracterise en ce que les amorces nucleotidiques sont 

10 choisies dans le groupe constitu6 des amorces selon Tune des 
revendications 6 a 9. 

14. Sonde nucieotidique selon Tune quelconque des 
revendications 6 £ 9, caract6risee en ce qu'elle comprend un compos6 

1 5 marqueur dont la presence est detectable. 

15. Proced6 de detection de la pr6sence d'un acide nucleique 
selon I'une quelconque des revendications 1 £ 5 dans un echantillon, 
ladite methode comprenant les etapes de : 

20 

a) mettre en contact une ou plusieurs sondes nucteiques selon 
I'une des revendications 6 a 9 et 14 avec l'6chantillon a tester; 

b) detecter le complexe 6ventuellement forme entre la ou les 
25 sondes et Tacide nucleique present dans I'echantillon. 

16. Proc6de de detection selon la revendication 15 t caracterise en 
ce que la ou les sondes sont immobilisees sur un support. 
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17. Necessaire pour la detection de la presence d'un acide 
nucleique selon Tune quelconque des revendications 1 a 5 dans un 
echantillon, ledit necessaire comprenant : 

5 a) une ou plusieurs sondes nucleotidiques selon Tune quelconque 

des revendications 6 a 9 et 14; 

b) ie cas echeant, les reactifs necessaires a la reaction 
d'hybridation. 

io 

18. Necessaire de detection selon la revendication 17, caracterise 
en ce que la ou les sondes sont immobilisees sur un support. 

19. Vecteur recombinant comprenant un acide nucleique selon 
1 5 Tune quelconque des revendications 1 a 5. 

20. Cellule note recombinante comprenant un acide nucleique 
selon Tune quelconque des revendications 1 a 5. 

20 21 Cellule hdte recombinante comprenant un vecteur 

recombinant selon la revendication 18. 

22. Polypeptide choisi dans le groupe des polypeptides suivants : 

a) un polypeptide comprenant une sequence d'au moins 15 acides 

25 amines choisi dans le groupe constitue des peptides de sequences SEQ 

ID N°129 a SEQ ID N°160, ou un fragment peptidique ou un variant de 
ce dernier ; 

b) un polypeptide ayant au moins 80% d'identite en acides amines avec 
un polypeptide tel que defini en a). 

30 23 - Polypeptide comprenant des modifications d'acides amines 

de 1 ,2. 3, 4, 5, 10 a 20 substitutions, additions ou deletions d'un acide 



WO 00/71710 



147 



PCT/FROO/01426 



amine par rapport a la sequence en acides amines d'un polypeptide 
selon la revendication 21. 

24. Anticorps dirige contre un polypeptide selon Tune des 
5 revendications 21 ou 22. 

25. Anticorps selon la revendication 23, caract6ris6 en ce qu'il 
comprend un compose detectable. 

io 26. Procede pour detecter la pr6sence d'un polypeptide selon 

Tune des revendications 21 ou 22 dans un 6chantillon ( comprenant les 
etapes de: 

a) mise en contact de I'echantillon avec un anticorps selon Tune 
is des revendications 23 ou 24; 

b) detection du complexe antigdne/anticorps form6 . 

27. Necessaire de diagnostic pour la detection de la presence 
20 d'un polypeptide selon Tune des revendications 21 ou 22 dans un 

echantillon, ledit necessaire comprenant: 

a) un anticorps selon Tune des revendications 23 ou 24; 

25 b) un reactif permettant la detection des complexes 

antigenes/anticorps form6s. 

28. Procede pour le criblage d'une molecule ou d*une substance 
candidate interagissant avec un polypeptide selon Tune des 

30 revendications 21 ou 22, ladite methode comprenant les 6tapes de : 
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a) mettre en contact un polypeptide selon Tune des revendications 
21 ou 22 avec la substance ou molecule candidate; 

. b) detecter les complexes 6ventuellement form6s entre ledit 
s polypeptide et lad it e substance candidate. 

29. Necessaire pour le criblage d'une molecule ou substance 
candidate interagissant avec un polypeptide selon Tune des 
revendications 21 ou 22, ledit necessaire comprenant : 

10 

a) un polypeptide selon Tune des revendications 21 ou 22: 

b) le cas echgant, des moyens necessaires a la detection du 
complexe form6 entre ledit polypeptide et la molecule ou substance 

15 candidate 
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LISTE DE SEQUENCES 

<110> AVENTIS PHARMA S.A. 

<120> Produits d 1 expression de genes impliqu£s dans des 
maladies gen£tiquement liees au locus 9q3l-34. 

<130> Extension FR61610K - AVENTIS 

<140> 
<X41> 

<160> 160 

<170> Patentln Ver. 2.1 

<210> 1 
<21l> 552 
<212> ADN 

<213> Homo sapiens 
<400> 1 

gggtaaatag ttgtgaacat aactattgtg aatactatgt tatatgttat agttgtgaat 60 

gtaaatagta ttcacaattg tgaatacaat gtaaatagct ttcacaattg tgaatacaat 120 

gtaagtagct atgtaaatag tgaatacaat gtaaatagct atgtaaatag ttgttatgct 180 

gattagggaa taatgagaag gaaaaaaagt atacatattc agtacagatg cagtcatctt 240 

tttttcccct cgaacatttt tgatccacaa ttggttgaat ccacagatgg ggaacacaca 3 00 

gtcttggtaa atttaaccaa caaggagggt aaacgcatcc caacagggaa ggtaaactgc 360 

acatccatca gtacctcttn gaggggcatc actggtttat aggcttcaat tacagtggac 420 

tatnttccag gantaatggg ccttttagtt tttccccnga angnttaant tggnggnttg 480 

ccntttgttt ggantgagnt tantcnaacn tattgangta atttttaaag gggntttcat 540 

aacagaaggc ct 552 



<210> 2 

<211> 1246 

<212> ADN 

<213> Homo sapiens 

<400> 2 

tagtggaatc agtaaggctt ggcagttgac 
taaagctaca tgtctgaaag aatgatgctg 
ttcgggctcc aacctgtcct aggaaggcct 
tcctctttgg ctactatgtc ttttccctga 
cttccacctg ttcatctgac ttagaccctc 
ggtgcttcgt ctgccatcag tacctccatt 
tatatttgct tcccactaga aagatcaaga 
tttctctaga cagttggtat ccacaatttt 



cttgtttgtt ggagagaagg gataagattt 60 
ctgattgaaa taaaggaaga aaggatgcat 120 
agacctcaaa caccaacacc tccatgcatt 180 
cttctgcctc tccagctctc tgggctgctg 240 
cctgctgggt ccttgttcac ctactcattt 300 
gcagctggtg ggatgtcagt caccatctct 360 
gaagttattt ctttcccttg cgctccaatt 420 
aaaaaatgtt ccatgttgta taaacaagca 480 
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ttcgccgaga ggggctgtta atacacatcg 
tcctacatta ttatgcatca aaatctccag 
ttaaatgcat tgttttgctt tgttttgaag 
atggtgggag ggtacatttg agttgtcaac 
gcacttggac tggaccaggg aaaggaatga 
gatgattata tttggcaaag ccaggaggag 
ctttgagtag catttctgga tgtctgagct 
tttcctttct gttggactgg ttcccagagg 
atatcagttc atgttttctc ttctgtcatc 
cctgctgcac tcacaacagc ttcccctctc 
gtttgagggg gatgcttgcc aaaggacagc 
gtttaacctt agactagcca aactagtgat 
ttgtgttgat gggactcaga aatcatgaga 



tgccccttct ataaaaattc atgcatggaa 540 
aaatgtctta ggatttttgc agggagaata 600 
agactagatg tgcagaggaa gagaggtggc 66 0 
agtctctgca gtgtcaggtc aattacatca 720 
ttctgcttcc tgggaatgtc agaaggacct 780 
tggctttgaa tgtcattgct aagaattaca 840 
tttcaaatga tacttctttt ctgctgtggc 900 
gtcctcttgt ttgtccttgc cctcgctttt 960 
ttccttccca gcgctgtttc tccaccccct 1020 
ctgtttagag gtggaagcat gtaagaatgc 1080 
atattcaaca tctggtatca acaaggtaat 1140 
gacctgcttc catgctgcat ctgctgcttt 1200 
aaggtcttca gtgatc 1246 



<210> 3 

<211> 3035 

<212> ADN 

<213> Homo sapiens 

<400> 3 

aactgagcaa agattgcctt tgcttcacct 
agagtacgga gtggggtctg agattctaca 
ctgtttgtct ggccaccaca cttctgaata 
tatttctcaa aaatttggct taggtacatc 
ttcagaactt aaccatgcaa caatgcagaa 
tattttaatg gaactataaa agcattgaac 
taaaccagca gcctaaagca ccttgctcta 
tagcttccaa ccttggctat gcattagaaa 
gtcccatttc cacaggattc tgattcaatt 
tttcagaagc tttacagggg attatgatgc 
attcacaact gtgtctcact ttattcttaa 
gatgctcaga gaagaaccac ctggtgtcaa 
cctcaatccc agatttcttg actccaaaat 
ttccttgagc tctatcatga attggtttta 
ttgtttcagt gtctccattt gtgagcaagt 
ttcttacccg aggtagaaat gcaataacca 
ggtaaatatt aagacacagt tcatcatccc 
tagggagtat aagggctgta cacagctatc 
gcacttgtac ctcagcagag agctaagaag 
actggagcta agtcttcaga gtcggcattt 
cttcactaga tgcaaggtcc tgttgaagat 
agtgacagca tggggaattt ctgagtttgg 
aagaagagta gaagaaagaa ctgagtggag 
gtttgtccct ggttaggatg agatgatagc 
gagagacagc cgggtgcggt ggctcacgcc 
999tggatca cctgaggtca ggagttcgcg 
ctatactaaa aatacaaaaa gatagccaga 



attgacacat ttaagaacct cgttttatag 60 
tttcttacaa gttcctggtt tatgccagtt 120 
gcaaggtttc agaggactct atgaagtttt 180 
tttacataca gtggtgctag atattattct 240 
gaatacaaaa aatgcttgca cacagtagtg 300 
tgattcctaa ctttacatat aaaggataat 360 
ctgttaatgg tacttatgag tttataacag 420 
cagcatttta taaatgatta gtcccactgc 480 
tacctgggct ggggccttgt cctctatatt 540 
ataattggga ttgagaatna ctgatgtagc 600 
tcccatgagg ccatgcagaa ggaaggaaat 660 
gcagatagct agccgaatgg caaagcagaa 720 
atgtagtcca aactgcctgc ccttgtccca 780 
tcctgagagt cagatcacat tacagggtac 840 
atatcacaat tcatttcact tttgagcagt 900 
tttcttggta ggtggtgtag gggatagaca 960 
ccaccttggc aaattacgga cacagcccag 1020 
atgcgcttga tcagtgcatg tcttcaaagt 1080 
catgaaggaa gtcttcatgg aggagatggc 114 0 
tggcaggtgg agattgggaa accagaggaa 1200 
tcaaggtaat gagacacata attgagaggg 1260 
gcagtaatgt gatcagaact gtactccagg 1320 
agaagactgg agtaggggat acgtaggagg 1380 
aggacccaga agaggttgca gtaaaaccaa 144 0 
tgtaatccca gcacattggg aggccaaggc 1500 
agcagcctgg ccaacatggt gaaaccccgt 1560 
cgtggtggca ggcgcctgta atcctagcta 1620 
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cttgggaggc tgaggcaaga gaattgcttg aacccaggag gtggacgttg tagtgagcca 1680 
agatcacacc attgcactcc agcctgggta acaagagtga aactccgtct ccaaacaaac 1740 
aaacaaacaa acaaacccac gagggagatc agtgtgaagg gcattgccaa agtggaatca 1800 
gtaaggcttg gcagttgacc ttgtttgttg gagagaaggg ataagatttt aaagctacat 1860 
gtctgaaaga atgatgctgc tgattgaaat aaaggaagaa aggatgcatt tcgggctcca 1920 
acctgtccta ggaaggccta gacctcaaac accaacacct ccatgcattt cctctttggc 1980 
tactatgtct tttccctgac ttctgcctct ccagctctct gggctgctgc ttccacctgt -2040 
tcatctgact tagaccctcc ctgctgggtc cttgttcacc tactcatttg gtgcttcgtc 2100 
tgccatcagt acctccattg cagctggtgg gatgtcagtc accatctctt atatttgctt 2160 
cccactagaa agatcaagag aagttatttc tttcccttgc gctccaattt ctctctagac 2220 
agttggtatc cacaatttta aaaaatgttc catgttgtat aaacaagcat tcgctgagag 2280 
gggctgttaa tacacatcgt gcccctttta taaaaattca tgcatggaat cctacattat 2340 
tatgcatcaa aatctccaga aatgtcttag gatttttgca gggagaatat taaatgcatt 2400 
gttttgcttt gttttgaaga gactagatgt gcagaggaag agaggtggca tggtgggagg 2460 
gtacatttga gttgtcaaca gtctctgcag tgtcaggtca attacatcag cacttggact 2520 
ggaccaggga aaggaatgat tctgcttcct gggaatgtca gaaggacctg atgattatat 2580 
ttggcaaagc caggaggagt ggctctgaat gtcattgcta agaattacac tttgagtagc 2640 
atttctggat gtctgagctt ttcaaatgat acttcttttc tgctgtggct ttcctttctg 2700 
ttggactggt tcccagaggg tcctcttgtt tgtccttgcc ctcgctttta tatcagttca 2760 
tgttttctct tctgtcatct tccttcccag cgctgtttct ccaccccctc ctgctgcact 2820 
cacaacagct tcccctctcc tgtttagagg tggaagcatg taagaatgcg tttgaggggg 2880 
atgcttgcca aaggacagca tattcaacat ctggtatcaa caaggtaatg .tttaacctta 2940 
gactagccaa actagtgatg acctgcttcc atgctgcatc tgctgctttt tgtgttgatg 3000 
ggactcagaa atcatgagaa aggtcttcag tgatc 303 5 



<210> 4 

<211> 1479 

<212> ADN 

<213> Homo sapiens 

<400> 4 

gtctgcagaa ttcgcccttg ctgccaccta tgtaccagct attccagatg accaagccct 60 
gctagaataa agactgactt ttcattgtga cctctgaagg atgtgcagct cagctttcac 120 
ctatccccac gttcacccaa gccaaaaaga agaattgtcc attcaaactg gaaatgatct 180 
ccagcttgga aatgagactc ctcatgagct tattctaaga tcagagtctg aaaattattt 240 
tctcaaaagt tacaaataaa tgtcttttaa cagtactgtc agactagtga ccaacaagtt 300 
actttatgag gatggatgat gatattagag ttcaagcaat tgtccagttt gtttcgatgc 360 
cacagtttgc ttttaaattc ccatagtgag cttccatctt gagacccact caacacagaa 420 
ggattacata aaggttgatc acccacgctc tacagatgaa caaattgaga cccagagatg 480 
ctaaactgct ctgcaggtca caaacctgaa cagcagcata gccaaaatgg gaacggagct 540 
cttctgacct caagcccctg cacttttttc ttaaccacat taattttatg aatatctatg 600 
tggtcaaagt ctcctttgta aaatccgagt ataagctgaa ctagatcatg tctctgtaag 660 
ctaagatggc agaaacacat tgtcatgtta gtttggagga gcaaacagat ataagtatgt 720 
gttgtaatgt tatagtgagc tgttatgtac cccccagcaa tgtccaaagt gatcagagct 780 
actagatgac ttattacaat gttcagatcc cactccttca ttccccctct ctcagtgacc 840 
tgtctacccc caagctttag aactgagctc tctccaactt agaactcatt agagtttgtt 900 
gcattagtga ttggatctcc tcatgaaagt tttttgacca atgacagtag agccccttta 960 
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agctagccag gcccaagata gggaagcact 
agttgtctat tgcatgcaga catcccctgc 
atccttcctt gtccagtttc tctacctaca 
ctctgccagt tgtctttgga cattttctgc 
ccacccactt ctagatcttc ctccatttaa 
gtgtattgtc cttgattagg gcagctgaca 
aatcctaagc aaggggctag ggagaactaa 
tactagaagg gtggaggtct cttaacaggc 
caggcttaag aagctctctc ttgtgactga 



gctggtttac atttctgctc tttctaattc 1020 
ccgacttctc cattatggaa ggctaaggcc 1080 
cactaacatg ccttttcccc atggagtgaa 1140 
agatgcaggc tcagttctgc tcttttgttc 1200 
tcccttattc ttataaggag tctaattttt 1260 
gctttacacc aaagctgaag tctctcactt 1320 
gatatccttc ccatatcaag ggatacaggt 1380 
tcactcacct ttcagagttt aaattatggt 1440 
gtgtattgc 14 7 5 



<210> 5 
<211> 5169 
<212> ADN 

<213> Homo sapiens 



<400> 5 

cagttctttt cattccatca ctttaggtga 
ttgattttgt tgtctagttt aatcctacct 
tgaatgtgac actgataata attatgctga 
tattaaagtt acatagagga ttgaaaaatg 
aggttataaa gggaggtacc taaatactca 
tggaatgctt taagcaattg ttttgaaaaa 
tgactttttc aagcagccat tcatccagag 
tcactttctt ttcaaagaaa tgttaattat 
acttggggta aaacccatgg ttatgtggaa 
ttgtaactca catcctttga gctaaactaa 
ggcattttta agaggtctga atttgtattt 
actttttttc attctcattt aaaatatatt 
gtgaccatta ctgcctacat ttgcgttgct 
atagtagctc attctctcta aaaatttact 
taaaacaaat gtaaatgagg aattttattt 
tcatatctgc actattatct gatgacatgt 
gagaatgaag taaaccaata gatactcttt 
ttgttcctca gagagagttt gaaagaaatt 
attccaggat ctaaatgaat gggaatttat 
agaaattttt agtagttgag ttgctttaag 
tcagatgctg ttgtataaaa ttttttacta 
aattcagtgc ctttttcctc taagcatact 
atgtttaagc tacagagcat tgttgtagtg 
aaatgcatat attaatcagg ggctggagga 
tttgaaactc ttcacataaa attttctaat 
gtttcatctc tgagaggctt tgtaataata 
tcatcacatg tattatttga tactaaattt 
gatttcttct tactggcgtt cttaaaggtc 
tgtttaagac gtttttagtt tatttgttgt 
cattttcaaa ctgaaaacta atcaaatata 
attaacttga ttatactata taacattctc 



tgggtaagat ttttgaaagc cttatatttt 60 
ttaatagttg tgtttggtaa aattcccact 120 
tttttagcat ctcttatagg aatcaaagtt 180 
tatatcactc aatttttatc taagaaggat 240 
aataatgtat atattctttt tcataacata 300 
aatctgcgta tctttgactt aattggcaca 360 
gcttgttttc tctcagtcct tttgctacat 420 
tacaaaaatt gacatagata tctttcccaa 480 
cataactgtt cttaaaaagt caattataat 540 
attaaaatta cagtatttaa taattctttg 600 
ttcttcattt ttgaaacttt acatttgttg 660 
gtgctatgat aaccaacctt cttccaagga 720 
ttctacatag agacttgtat aatagtatta 780 
gcccactgag aggatgtttt gtttccttga 840 
gaattggaat attgtttttc tagaggacat 900 
tggtaatttt aaagactgca aggcagttta 960 
tgattctcca aagaaatata attttggttt 1020 
ttcagatgtt ctgttcccta tagagggcct 1080 
aattcctttc atagactcaa acctgaaagc 1140 
tgaattttaa caaatatgac acagaaaagg 1200 
gtgtgtctta tataattctt tcttctcatt 1260 
cttggtccat gccccatgca gtgtcaactg 1320 
gtgagggccc tctgttgcag gggcatgggg 1380 
gtatacatga ttcttgtgtt catgttgtca 1440 
attcatttgg aaaacctctc cactggagag 1500 
gtgtaagttc agtaaatcca gtccaaattc 1560 
tcaattatta cttcaaaata agagtctgag 1620 
tctaaaatta aagaacaaga tgtggttttt 1680 
taagttaaac tggagaaagt ttgtcatcct 1740 
gtgcctattt agtctcaaaa taaggtaact 1800. 
aattacattc gaatttaaaa atattgagct 1860 
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cttgattaca atttaataca ttgtaaaaag tattaaatcc tttgaaacat cttttgttgc 1920 
ttatttagtt tttgtttcta caggccaaac atgattgctt tctataaaag aaatgcttga 1980 
gaggttgact ataatggata tgtcacaggt ataaaacagt tgttttctaa aaacatgcat 2040 
ttagtatgcc attctctttt agcaactgaa ttcccaacga gttttattaa gctggatatc 2100 
gaaatgaagg agctgcctta agcactttag aaaaagaatt tttttacaat tcattttgac 2160 
tctcatggct gaccatgtca ttatgtcttt aaattttggt aaatatgtag ataccaagca 2220 
ttaataacta atgcacacag aaatttaata tacagcaatt ctttgaatgt tccaggtgta 2280 
cgtaaactaa ctgaaagtat taaggacatg cctgtctata catgggtttc attgatggta 2340 
tctgtatcat ctcgacaaat cgtgaactgc tgctgtatgg ctagaccttg cctatttact 2400 
ctgttatgca aacagtaatt tttccctatg ttatgaagag agacatattg gcttgcttts 2460 
atttacttat ttatgaaatt aaagcatgaa taatatgtat aatttgaatt ttttgtgact 2520 
gatccttggc agtataaatg ataaaagtaa atgtaatgga atcttttaat taggctaaga 2580 
tatgctattt cataacttat gtagaatgat ttttatctat atactttgtc cataaaatta 2640 
taattgttta tgtaatttta ttgtttctta tggaaacaat tggaaaagta tatggaaaat 2700 
gattatttca aagaatattt atttaaagag ggaagtgtag acttcttact gtaaaatatg 2760 
tgattccagg cttaagaaat tgattatatt ttaaaataat tattttttta aaaacgtaat 2820 
ttgtttttaa aagatgagtc tccattcatt ggctaatcca t.acagcaaat atttgagtgt 2880 
ttgtgatatg gcagtaaaaa tgtgattact ttgtatgtac attaaccaaa accagtgaag 2940 
tttgatggac tgtgcataga gttttgcagc ttttgagtag tgtgacagag tttgcctctt 3000 
aaaattgttt tgctaataag tcagaagttt aaaatgtgtt atagtttgct aaaaaaaaat 3060 
caaattaact gcatataaaa tggttcactt ttatatagtc acatgtaatg ggcctgaaaa 3120 
agtttcttct ttgattatgt agttactcta gatacattct tttagggaag tgtatggtca 3180 
acatatattt actcagtata cagataacca caaagttgtt atttttaacc aaaatataca 3240 
tttcataatg ttggcactgg agtattataa gagatcatga atgtttcctt aattatcatg 3300 
gcaagattac ctcacgttca gtatagttta gttttgtgtg tatcttacag tatgcatgtt 3360 
ctgaaattat ttgtgatcct gatatgtcac atataatagc tttgttacct ggagtatttg 3420 
attaacctaa acagtttaag cattttgaat tagttggagt ttaaatggat tacatttggt 3480 
gtatattgtc ttcattgaaa agatattgtt ggatatgcca catcagagtt agcattgact -3540 
tataaataaa taccagaatt taccagagta cacttttctc ttcagatgac tcaattatta 3600 
aataaaagaa tatttcttat ttctgggtca atataaggta ctgacttctg atgcataatc 3660 
acttaagcta tgtgagttta aactggtatc ttttcttagt ggtacccatt caatgtaagc 3720 
tggtccatgg gaatggacat gaagaggatt tcacagtatg tagagcagaa ggcacgtgaa 3780 
tgtgtttgct ttggcttgga gcttattaag ttttgactac ggttaaaata agtcaaatag 3840 
taagtggtaa aacacatttt tgttagtatt ggaactttct ggagaacata agggctatga 3900 
gaatgcatat atatattttt taacatttcc tatatatcta aggtaccaaa gcactgagtc 3960 
taatttacct attaagggag actctttaaa atcaacttta taactaattc atactataag 4020 
acagataata gctaaagttt tggaataatt tatattaaaa gccgcaagtc ttaaaaatcc 4080 
ctggatatga cataaaaagg attttggctt cttttttgaa gtatttaaaa ttaatcacct 4140 
tagctccacc atatactaga tctgtgaccg ctacacaaat tgtttatcat ctttgggtct 4200 
ctattgcctt ctttataaaa taagtgtaag ttgttcagcc tgcctcacag ggctgttgtg 4260 
aggaaataaa atgaaatgga gtatgtgaaa ttgcttcagc aacagcaaag tgctacgtaa 4320 
atgtaaagtg ttgtttttag ctaataatgg atttaagtgt ttggataatt gtagatgcat 4380 
ttactttgat aaagcgtgtg cttaaagtgg tatcaccagt gatttctaac atgattttaa 4440 
aaaaataaaa ccccaattaa aatgttcttt aatattcatc taatttgtgc atgacttgtg 4500 
gcctttttgt attttctcaa gcctattact ctagagctgt aaaagctctt gcacagcatt 4560 
gttgtgtcag tgtagaatag tggcacaaat aaatgaatta agctacattt ccatgcaggc 4620 
atttgcactt tgaagttagg gctgcccagt gccacatgca aagagtgtat ttggtctaaa 4680 
cagttctttc caaacaacca aatggctggg cagcttgttg tcacggataa atgatataaa 4740 
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atgtaaccac tgaacatttg acaactttgt 

atttcaaaat cttgttaacc tggttatctc 

tttaaattgg attaaacggt ttacaggtta 

tctggacatg attttgctat gcagttgtga 

cttttaagtt atggctgaag acctttaatg 

agtgttttaa gaagcacatg gcctcatttt 

tgtttttttt tcactttaaa atagggtatt 
ttttgtgtt 



tgcattatca tttttaaaaa aagatgaagc 4800 

ttggtatctc tcctgacata tttgttttgc 4860 

tctgaatcta cagatttagt atgtctatta 4920 

taataaaaat tctaattcct caggtttggc 4980 

atacttatga tgcactcagt gccatacaat 5040 

ccttagaaac aagacaaagc ctttttaaaa 5100 

caaagtggag taacgtgtat tttgaaatga 5160 

5169 



<210> 6 
<211> 7723 
<212> ADN 

<213> Homo sapiens 
<400> 6 

gtggggccgg gcggtgccgg tgcgggctgg 
tgcgatctcg ctgagcctcc tcacacggtt 
agccactcgc catggactcc cagaaatact 
ataaagcctg ttttctgatc tctaacatca 
aggaagctct acagaggatc atttcaactc 
ttattgatac actacatcat acactaaaag 
cagagttaga tgaagaattt gatagtttat 
tgattaactg tatcaagcag gaacaagctc 
gtcaatgtaa taatgccctg gagaactctg 
tagatataaa ggaacctgaa gaattttcaa 
caatggcttc agcctttcgc ctttctttga 
taatggtgga tttctcacag gaaagacaga 
ccaaagctcc agagatagat ccagtagagt 
cttggagaat gccagaagaa gataataaga 
ctaattttga tggacttcca cgtgtaaagg 
ttaagggtac tgaatataca ctatcaggct 
gagtgcgagc ttgtaacaag gctgtggctg 
ccaaagcact taacttcaat ttggataact 
atacatgtgt agagtgggat cctactggag 
aagagaacaa gggcagtgtc catgttactt 
catccccaaa acgaacatct gtaggctcca 
gttttactgg agaatcatac acagtgctgg 
attgggaggt caaggcccag aaggattgta 
cgttggggaa atttgaccaa ttgggaaaga 
actggctaca aaacacattt gcagcaaagc 
ctgttctgaa aaaataggtg tattttgtga 
tgcaaattct aaacagctgc tatattcctt 
tggtttcatg gtatggtgtg gtggactttc 
tgtgagaaca cttcagaaaa gtgaaaatgg 
tgttgttact caatagtgtc tactcagaat 
ttttctgtgc agttactaat cacaggaatt 
tctgctttga ggcctggaat cttttatcat 



ggcagtgcag tgagtagcgg tcttggggtg 60 
cgtcgtctcg ggttcgagcc cagtgggctt 120 
gctttaagga gaatgaaaac gttacagttg 180 
ctattggacc agagtctatt aacttgcagc 240 
tggcaaataa aaatgatgaa attcagaact 300 
gagttcagga aaattcgtcc aacatactct 360 
actctatact ggatgaagta aaagaaagta 420 
gtaaatccca agagttacag agtcagatta 480 
aagaactatt agaatttgca acaaggccat 540 
aggctgccag acagatcaag gatagagtca 600 
aaccaaaggt cagtgacaac atgactcatt 660 
tgctgcaaac tttgaagttt ttgccagtcc 720 
gtttggtggc agataactct gtaacagtgg 780 
ttgaccattt tatactggaa cataggaaga 840 
atgagcgatg ctgggagata attgataata 900 
taaaatttga ttcaaagtac atgaatttca 960 
gagagtattc tgatccagtg actctagaga 1020 
cctcatccca tttgaacctg aaagttgaag 1080 
gaaaaggtca agaaagtaaa attaaaggaa 1140 
cactgaagaa acatacaaga agtggtacac 1200 
ggccaccagc agtaagaggc agtagagatc 1260 
gagacactgc tattgaaagt ggacaacatt 1320 
aatcctacag tgtgggagta gcatacaaaa 1380 
caaacactag ttggtgtatc catgtcaaca 1440 
ataataataa agtcaaagct ttggatgtta 1500 
ttttgatggg ggtcaacttt cattctatga 1560 
taagacaaaa tttactcagc cagtactacc 1620 
tttgagtact gggatgcagg ttccaagtgc 1680 
aatgactggt tcagctagca gcctgaacaa 1740 
acgtttaccc tccgtcttga ttaggtggcc 1800 
tggtagtagt gaaaatcagg tttgctgtgt 1860 
taaacaccta gtacgaagca tttgcaggaa 1920 
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cctactgtgc agtatcatag aggcaagcag 
taaatggggg aaaaggcagt gtttaattaa 
tactttgact attctaatgt ttaattacat 
ttttaaatct tgccttcttt cttctgtact 
tatttagttc taacacagaa gctttaaaaa 
gaaatcatat gttgggaatg gtaaaaaggt 
aataagtttt acaaaatttt cctcttttgt 
tttccaaaat attgtgataa gaaatttcta 
agttctttac ctaactgcac taacaatggc 
ttaactacag ttcttttcat tccatcactt 
atattttttg attttgttgt ctagtttaat 
tcccacttga atgtgacact gataataatt 
caaagtttat taaagttaca tagaggattg 
gaaggatagg ttataaaggg aggtacctaa 
taacatatgg aatgctttaa gcaattgttt 
tggcacatga ctttttcaag cagccattca 
gctacattca ctttcttttc aaagaaatgt 
ttcccaaact tggggtaaaa cccatggtta 
ttataatttg taactcacat cctttgagct 
ttctttgggc atttttaaga ggtctgaatt 
tttgttgact ttttttcatt ctcatttaaa 
ccaaggagtg accattactg cctacattcg 
agtattaata gtagctcatt ctctctaaaa 
tccttgataa aacaaatgta aatgaggaat 
aggacattca tatctgcact attatctgat 
cagtttagag aatgaagtaa accaatagat 
ttggtttttg ttcctcagag agagtttgaa 
agggcctatt ccaggatcta aatgaatggg 
tgaaagcaga aatttttagt agttgagttg 
gaaaaggtca gatgctgttg tataaaattt 
tctcattaat tcagtgcctt tttcctctaa 
tcaactgatg tttaagctac agagcattgt 
catggggaaa tgcatatatt aatcaggggc 
gttgtcattt gaaactcttc acataaaatt 
tggagaggtt tcatctctga gaggttttgt 
caaattctca tcacatgtat tatttgatac 
gtctgaggat ttcttcttac tggcgttctt 
ggttttttgt ttaagacgtt tttagtttat 
tcatcctcat tttcaaactg aaaactaatc 
ggtaactatt aacttgatta tactatataa 
ttgagctctt gattacaatt taatacattg 
ttgttgctta tttagttttt gtttctacag 
tgcttgagag gttgactata atggatatgt 
catgcattta gtatggcatt ctcttttagc 
ggatatcgaa atgaaggagc tgccttaagc 
ttttgactct catggctgac catgtcatta 
ccaagcatta ataactaatg cacacagaaa 
aggtgtacgt aaactaactg aaagtattaa 



ataccaagca aaaaactgat gattgaagag 1980 
cataaaaact catttttgta tttcttggat 2040 
atggtaaccc taaggcctgg ggagaaaagc 2100 
ttgtcttttt aaaatctcat tactatctat 2160 
tacatagtca tccaaggttt tctaaaaatt 2220 
tttcaaatgg tttatcttcc ctcttttata 2280 
ttattgacta gattgtatat aattttcttt 2340 
gacacaacag cttaaaatca cccaaatttc 2400 
aaggggggta ttctttatat gttgccttgt 2460 
taggtgatgg gtaagatttt tgaaagcctt 2520 
cctaccttta atagttgtgt ttggtaaaat 2580 
atgctgattt ttagcatctc ttataggaat 2640 
aaaaatgtat atcactcaat ttttatctaa 2700 
atactcaaat aatgtatata ttctttttca 2760 
tgaaaaaaat ctgcgtatct ttgacttaat 2820 
ttcagaggtt tgttttctct cagtcctttt 2880 
taattattac aaaaattgac atagatatct 2940 
tgtggaacat aactgttctt aaaaagtcaa 3000 
aaactaaatt aaaattacag tatttaataa 3060 
tgtatttttc ttcatttttg aaactttaca 3120 
atatattgtg ctatgataac caaccttctt 3180 
cgttgctttc tacatagaga .cttgtataat 3240 
atttactgcc cactgagagg atgttttgtt 3300 
tttatttgaa ttggaatatt gtttttctag 3360 
gacatgttgg taattttaaa gactgcaagg 3420 
actcttttga ttctccaaag aaatataatt 3480 
agaaattttc agatgttctg ttccctatag 3540 
aatttataat tcctttcata gactcaaacc 3600 
ctttaagtga attttaacaa atatgacaca 3660 
tttactagtg tgtcttatat aattctttct 3720 
gcatactctt ggtccatgcc ccatgcagtg 3780 
tgtagtggtg agggccctct gttgcagggg 3840 
tggaggagta tacatgattc ttgtgttcat 3900 
ttctaatatt catttggaaa acctctccac 3960 
aataatagtg taagttcagt aaatccagtc 4020 
taaattttca attattactt caaaataaga 4080 
aaaggtctct aaaattaaag aacaagatgt 4140 
ttgttgttaa gttaaactgg agaaagtttg 4200 
aaatatagtg cctatttagt ctcaaaataa 4260 
tattctcaat tacatttgaa tttaaaaata 4320 
taaaaagtat taaatccttt gaaacatctt 4380 
gtcaaacatg attgctttct ataaaagaaa 4440 
cacaggtata aaacagttgt tttctaaaaa 4500 
aactgaattc ccaacgagtt ttattaagct 4560 
actttagaaa aagaattttt ttacaattca 4620 
tgtctttaaa ttttggtaaa tatgtagata 4680 
tttaatatac agcaattctt tgaatgttcc 4740 
ggacatgcct gtctatacat gggtttcatt 4800 



WO 00/71710 



8 



PCT/FR00/01426 



gatggtatct gtatcatctt gacaaatcgt gaactgctgc tgtatggcta gactttgcct 4860 
atttactctg ttatgcaaac agtaattttt ccctatgtta tgaagagaga catattggct 4920 
tgctttaatt tacttattta tgaaattaaa gcatgaataa tatgtataat ttgaattttt 4980 
tgtgactgat ccttggcagt ataaatgata aaagtaaatg taatggaatc ttttaattag 5040 
gctaagatat gctatttcat aacttatgta gaatgatttt tatctatata ctttgtccat 5100 
aaaattataa ttgtt'tatgt aattttattg tttcttatgg aaacaattgg aaaagtatat 5160 
ggaaaatgat tatttcaaag aatatttatt taaagaggga agtgtagact tcttactgta 5220 
aaatatgtga ttccaggctt aagaaattga ttatatttta aaataattat ttttttaaaa 5280 
acgtaatttg tttttaaaag atgagtctcc attcattggc taatccatac agcaaatatt 5340 
tgagtgtttg tgatatggca gtaaaaatgt gattactttg tatgtacatt aaccaaaacc 5400 
agtgaagttt gatggactgt gcatagagtt ttgcagcttt tgagtagtgt gacagagttt 5460 
gcctcttaaa attgtcttgc taataagtca gaagtttaaa atgtgttata gtttgctaaa 5520 
aaaaaatcaa attaactgca tataaaatgg ttcactttta tatagtcaca tgtaatgggc 5580 
ctgaaaaagt ttcttctttg attatgtagt tactctagat acattctttt agggaagtgt 5640 
atggtcaaca tatatttact cagtatacag ataaccacaa agttgttatt tttaaccaaa 5700 
atatacattt cataatgttg gcactggagt attataagag atcatgaatg tttccttaat 5760 
tatcatggca agattacctc acgttcagta tagtttagtt ttgtgtgtat cttacagtat 5820 
gcatgttctg aaattatttg tgatcctgat atgtcacata taatagcttt gttacctgga 5880 
gtatttgatt aacctaaaca gtttaagcat tttgaattag ttggagttta aatggattac 5940 
atttggtgta tattgtcttc attgaaaaga tattgttgga tatgccacat cagagttagc 6000 
attgacttat aaataaatac cagaatttac cagagtacac ttttctcttc agatgactca 6060 
attattaaat aaaagaatat ttcttatttc tgggtcaata taaggtactg acttctgatg 6120 
cataatcact taagctatgt gagtttaaac tggtatcttt tctta'gtggt acccattcaa 6180 
tgtaagctgg tccatgggaa tggacatgaa gaggatttca cagtatgtag agcagaaggc 6240 
acgtgaatgt gtttgctttg gcttggagct tattaagttt tgactacggt taaaataagt 6300 
caaatagtaa gtggtaaaac acatttttgt tagtattgga actttctgga gaacataagg 6360 
gctatgagaa tgcatatata tattttttaa catttcctat atatctaagg taccaaagca 6420 
ctgagtctaa tttacctatt aagggagact ctttaaaatc aactttataa ctaattcata 6480 
ctataagaca gataatagct aaagttttgg aataatttat attaaaagcc gcaagtctta 6540 
aaaatccctg gatatgacat aaaaaggatt ttggcttctt ttttgaagta tttaaaatta 6600 
atcaccttag ctctaccata tactagacct gtgaccgcta cacaaattgt ttatcatctt 6660 
tgggtctcta ttgccttctt tataaaataa gtgtaagttg ttcagcctgc ctcacagggc 6720 
tgttgtgagg aaataaaatg aaatggagta tgtgaaattg cttcagcaac agcaaagtgc 6780 
tacgtaaatg taaagtgttg tttttagcta ataatggatt taagtgtttg gataattgta 6840 
gatgcattta ctttgataaa gcgtgtgctt aaagtggtat caccagtgat ttctaacatg 6900 
attttaaaaa aataaaaccc caattaaaat gttctttaat attcatttaa tttgtgcatg 6960 
acttgtggcc tttttgtatt ttctcaagcc tattactcta gagctgtaaa agctcttgca 7020 
cagcattgtt gtgtcagtgt agaatagtgg cataaataaa tgaattaagc tacatttcca 7080 
tgcaggcatt tgcactttga agttagggct gcccagtgcc acatgcaaag agtgtatttg 7140 
gtctaaacag ttctttccaa acaaccaaat ggctgggcag cttgttgtca cggataaatg 7200 
atataaaacg taaccactga acatttgaca actttgttgc attatcattt ttaaaaaaag 7260 
atgaagcatt tcaaaatctt gttaacctgg ttatctcttg gtatctctcc tgacatattt 7320 
gttttgcttt aaattggatt aaatggttta caggttatct gaatctacag atttagtatg 7380 
tccattatct ggacatgatt ttgctatgca gttgtgataa taaaaattct aattcctcag 7440 
gtttggcctt ttaagttatg gctgaagacc tttaatgata cttatgatgc actcagtgcc 7500 
atacaatagt gttttaagaa gcacatggcc tcattttcct tagaaacaag acaaagcctt 7560 
tttaaaatgt ttttttttca ctttaaaata gggtattcaa agcggagtaa cgtgtatttt 7620 
gaaatgatct tgtgttctat atagaatgtc ccagttaaga ttttacagaa gcacctggaa 7680 
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tatctcatta aaaatttaaa aactcttaaa aaaaaaaaaa aaa 7723 

<210> 7 
<211> 1046 
<212> ADN 

<213> Homo sapiens 



<400> 7 

ccttcagtgc tcagaggagc agacacagtt 
cttgtgctaa ttaaaggagg aagcactgct 
cctgttcagc atgataatgc agctcccctg 
tgtgactttg atgaaagcat ctgcagttat 
tttcccattt ccatcatttg agcttgaaat 
agaagtcacc ttatttctca tgtttctaat 
taggataagc aaacagcaaa aaattaccaa 
tgaactagat agattagatg tcatcctgtg 
tttcaaacag tacagggtct attttcagtt 
tgttaaaggt tgctttcaga agaaaagccc 
tgagagcgaa caacagactg gatgccataa 
gaaactgtgt tacaattcag agaaaagaca 
cagatttaga tgatccaata tgcttattat 
aagaagacag aataccaggc aaaattaatg 
aaagtatcaa tttcaagaat aaaagaatta 
tacctgtaaa aggtgaaaaa aaaaaacagg 
aaatggaaca tttttacgat cacctaaaat 
aaaggcaaca gccttcttgc cacaac 



gctcactctc cactcaaagt tggtccaggc 60 
gtagcgcaga aggaaaaggc cagtcctcca 120 
tggtaagggt tggtcggact acaatatctt 180 
aatgtggcaa agaaaaggat aattccagaa 240 
atctgaatag atatttacaa aaccttgtga 300 
gaacatatat aaacttctca tttccagctc 360 
tgaaaagtta ggagttcaaa agaagtagtc 420 
aaataggttt accacatgat agggaagaac 480 
attcactatg aaatgagaac atttcacagt 540 
aactgatgaa tgtttttaaa aatgcactat 600 
ttttatagtc aagtttggga caagttttaa 660 
gttggtgagc atattaagag atatagggaa 720 
cagaattcca gaaaaaggca tgaaatcata 780 
aaaaaatatt aatccaaaca catataataa 840 
tataagcatt taacacacat aaacattggt 900 
ttcagatttt ctgcttaaat atcaaagggc 960 
tcttgaaata ggccaagatt tttcatatac 1020 

1046 



<210> 8 
<211> 280 
<212> ADN 

<213> Homo sapiens 



<400> 8 

gggagaggag gcagaggcca gatcctgaaa 

acttcagagg cgacaggagg gtagtgaggt 

acccttgttt gatatccatc ccattccctc 

gaccctcctg ctgtggcaag atcctgattg 

tgctcatcct cacgcagtcc tcagccctct 



aactcttcag tggtggactg aggtgcctgg 60 
ttctggagca ggctggtcaa agtcagcagc 120 
accccacatc tacctgggac ttgcttctct 180 
tcccaggtgc acatggctct acttcctgac 240 
atgacccccc 280 



<210> 9 
<211> 479 
<212> ADN 

<213> Homo sapiens 



<400> 9 
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aaatcaagaa catcattctc tcggtatctt 

gtgaccttgc agctagccta accacattct 

catagaccta gagtccactg actatgaaag 

gagtgtataa tcttcctagt tcctaaatct 

agagggagca gccccttcac tatataacca 

tctatggtga ataatgaatc cattctaggc 

gggacagtca cgtgcaagga gaaaagagaa 

gcacggagat acagactaca caaactagaa 



tatggagcaa aatgtttatg gtagagacag 60 

ccaagtgtta attagatggt gcaatattca 120 

gctctgacct ttttgcggct tctttaccag 180 

ttctaagaga acctgactac ctccaggtct 240 

atttccctga ctgcacatat ggtaattcca 300 

caaatagata ctcttatgca gagcccagct 360 

agccagactg cagacatagc taatgcaaag 420 

gaaacgtaga gtaagctgct ttgtctctt 479 



<210> 10 
<2ll> 2599 
<212> ADN 

<213> Homo sapiens 
<400> 10 

gaaatccagg ggaccaatgc attttatcac 
taccaaaagt tgtctgattt aaagttgtaa 
tccacttttg ctgaagatat tttttattga 
ttacctaagt ggataaaatg tacttttgat 
tagttctaaa ttgactttac gtattactgc 
tgataaacca caattggctg atattgaaaa 
tgattactgt cgataactgc agataaattt 
cacagttgtt tatactgccc atcctaggat 
acatcttctg gtaaattgtg cgtccatatt 
tgggggaaat acgacttagt gaggcataga 
tgtttcttgg aacctgctct cctgcttgct 
cacagccgtt tgactgaagg ctgctctgga 
tgggacccac Ctccatttcc ttcagtcatt 
gagattgagc agatgaggct tgggatgccc 
gggatggcag caaggtggct cctgtggcag 
tatcgcctat aagacagggt aaggtctgaa 
gatagtgctc aagaagtgcc ttgagttggt 
atttcaggtt ttattacaaa atgtaagtgg 
gttacctttt ttctctatgt ctgagaactg 
ttagagtgca caacaaaatc actatcccat 
cttgcactgg aagaatcgta agtcaactgt 
atggtagtga ttccaaataa tggttctgtt 
attttgagat actaaggatt atctttggac 
attactggaa tacccatggg ccctctcaag 
tgtcagtaca ttaaacttct caatcccatt 
aaaaatatgg ttaataacat tcaacctgtt 
ttgtttttat tttttaacaa gatttgtgaa 
ctttttcacg tcgtgccaac ggaatagggt 
gcttcaaaat gtcaattgct ttaaacttaa 
cctcattgtg tatataatgt ttaatatttg 
ttctataaag tatgggtact atgttgctca 
ttgtacccca aataacatcg tctgtacttt 



taaaactatt tttatataat tttaagaata 60 
tacatgattt ctcactttca tgtaaggtta 120 
atcaaagatt gagttacaat tatacttttc 180 
gaatcaggga atttttttaa agttggagtt 24 0 
agttaattcc ttttttggct agggatggtt 300 
tgaaagaaac ttaaaaggtg ggatggatca 3 60 
gattagagta ataattttgt catttaaaaa 420 
gctcaccttc caagattcaa cgtggctaaa 4 80 
cattttgtca gtagccagga gaaatgggga 540 
catccctggt ccatcctttc tgtctccagc 600 
ggtccctgac gcagagaccg ttgcctcccc 6 60 
gacctagagt aaaacggctg atggaagttg 720 
agaggtggaa gggaggggtc tccaagtttg 780 
ctgctttgac ttcagccatg gatgaggagt 840 
tggagttgtg ccagaaacag tggccagttg 900 
gagctgagcc tgtaattctg ctgtaataat 960 
gtacagtgcc atggccatca agaatcccag 1020 
tcacttggcg attttgtagt acatgcatga 1080 
tcagattaaa acaagatggc aaagagatcg 1140 
tagacacatc atcaaaagct tatttttatt 1200 
Ctcttgacca tggcagtgtt ctggctccaa 1260 
aacactttgg cagaaaatgc cagctcagat 1320 
atgtactgca gcttcttgtc tctgttttgg 1380 
agtgctggac ttctaggaca ttaagatgat 1440 
atgcaatctt gtttgtaaat gtaaacttct 1500 
tattacaact taaaaggaac ttcagtgaat 1560 
ctgaatatca tgaaccatgt tttgataccc 1620 
gtttgatatt tcttcatatg ttaaggagat 1680 
attacctctc aagagaccaa ggtacattta 1740 
tcagagcatt ctccaggttt gcagttttat 1800 
gttactcaaa tggtactgta Ctgtttatat 1860 
ctgttttctg tattgtattt gtgcaggatt 1920 
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ctttaggctt tatcagtgta atctctgcct 
aatttccatt gaagtcgaat gatactgaga 
tgtgtttccc cataagtttt tttaaattgt 
atgtaaatag gaaatagaag agtgatgctt 
tggaagcagt gcaaataaat tacatttttc 
gtgtatacgt tggaatgagt catgccatat 
tgagttacaa gagtctttag aagttttcta 
gcgtgttcgg ggagtgccct cctgtctgca 
cacatgctta ggggtgtggg tcttccattg 
ctgttgcctt tgggtcagca catttgttag 
agaactggaa aaatgatgag atgtggtccc 
ttgtgaatag gattgctct 



tttaagatat gtacagaaaa tgtccatata 1980 
agcctgtaaa gaggagaaaa aaacataagc 2040 
atattgtatt tgtagtaata ttccaaaaga 2100 
atgttaagtc ctaacactac agtagaagaa 2160 
ccaagtgcca gtggcatatt ttaaaataaa 2220 
gtagttgctg tagatggcaa ctagaacctt 2280 
accctgccta gtgcaagtta caatattata 234 0 
ggtgtgtctc tgtgcctggg ggcttttctc 2400 
gggcatgatg gacctgtcta caggtgatct 2460 
tctcctgggg gtgaaaactt ggcttacaag 2520 
caaacccttg attgactctg gggaggggct 2580 

2599 



<210> 11 
<211> 222 
<212> ADN 

<213> Homo sapiens 
<400> 11 

gtaggagaga agtatggcta cctttcactt ccaaagccaa tggtaagtag aagaattatg 60 
tacattgcag aatgttttta ttcagaattc aaattatgct cttgttgcct gttgctgctc 120 
ccctctacca caaataattg acatgacaga aaaaagttag gatattaatg ttgacttcag 180 
agttgttatt ctgggtagca atctagttgt ggcttacact ct 222 



<210> 12 
<211> 3422 
<212> ADN 

<213> Homo sapiens 
<400> 12 

gaagtcactg ataattataa ttagtttaaa tttattctta cactacttaa gaaaaatttc 60 

atttagaaaa ggctaccatg agatcttttg actatatgga gtagactgca tacagatctc 120 

tttatttcta ttatgaatat tttagcgatt ataatcagct attccactga gtattagatt 180 

tggtcactaa gtaactcatg tttttcttta gtcaatcatt cattcattca ctaaaacatt 240 

tgttgagagt tggctaaact ctagattctg tgccaggcac tgtacagggt gatggagatc 300 

actcataaga aggcctcttg ctcttagcca gatcatatgt aatactaaat ttaaattttt 360 

tgcattaaaa ggctaaaaaa tcatttgttt ttgttaatta tatactggtt gatttataga 420 

tgtaattagc acatattcat aagagacaaa tatatacaat gagttactat acatatacaa 480 

agtgatttta gctgtataaa gtgatattgc aaaaaactac agctaatgtt tcttgctggg 540 

taattattag cataaatatc aggttcttag aggtctttaa gagaatactt tagagctacc 600 

aaaattagca gcagtgatgt aatatcaccc tgaaatacca ggagcagagg tgccccagag 660 

tgcttcacag ctatgatcag gaaacttgac ctgccccatt gctacagcaa cggcataagg 720 

actaggaagg tccactagct ggggaggtct tggaaccctc cgagccagaa agaagcattc 780 

cagcatgatt cctcagatgc aatgaggaag gtctacagaa ttttcacagg gcaacagaga 84 0 

tcaagtggta tgaaaaggta ggagttttaa gctcaagtct caaagataac ctacctttac 900 

attctcagtc agaatttgac ccagaaagag gaagttcctt caggaacaga ccgtacgttg 960 
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atgaagtaga agtcatttca gtaaaaacgg 
tttatagatt tattaaagat tagtttcaag 
tggatgggag gggagaaaat acaagctctc 
gagaaggcat gggattttca gcataaattc 
agttcctatc aatatctgtt cctgcaagtg 
ttagttattg ttaaaattgc aaggtttctt 
ggcagagctc tcccttgact tctgagtcta 
atccaacatg ttacatggag accttgtatg 
actgcttttc acagttaaag ggctgctaaa 
ttgatcttca catgaaccca ttgtgaccta 
ttgggttata ttagtgcctc aggaatgtgt 
aggctgtgag gggttagatt agaggaaagt 
ctcagggttt ataggaaaaa aaaacaaaat 
gccctgacct tgcagtctcc tctgaggggc 
aggactttga gtgtgcattt cacatgtgga 
ctagttccag ctaaaaacaa gtacttttta 
caaaatatat tcattttatt aacttaccga 
aacacacatg ctgtctgcag ccactgtttg 
atcaagttgt tctgtctact agagtcagaa 
aggtggtcct gtcactttct agagaaagac 
acatacacat acagccagtt agtaacagaa 
gtcagtccgt tgttctactt ctctttcctt 
tgtgttccat atagcagtag ttccaagaga 
tgtgttgggg gtgggggatt gcatggtcaa 
ttactgtagg acttctaaga gttttgaaca 
ggacaaacac tgtttgacct tagactgcac 
aggaccacag ggtcctttga gaaacatggc 
acatccctaa tggaaatact gaatggcaga 
taaatcttga agtccagaaa gcaagtatat 
agattctttt ccacctgtgg tgtgtaaaat 
aaggatcaac taatgtgcaa atacagtggt 
tttgtatggc actttatagt tttcagacac 
attatcctta ttgtacagat gggggggctc 
cccctaagtt tataccacaa aatgatggag 
aagtccagag ttctttacta gacatctggt 
ttacagtgaa aagtatggaa gcaaatcctg 
attttttatt gcagagaccc agcagatgta 
cttctttgcc ctttgcagtg ccacttattt 
tgattttgaa ctaagatttg atatagagtt 
atcatccctg ggttctcagg tgaaggaggc 
caataaatac cctctgttct cacacaaatg 
ta 



agtacagaac ttggtcataa tatcttgcat 1020 
ttcacattcg ctattcagtt gtaaaccgaa 1080 
cacacaggta tgctcctctc ttttctgaga 1140 
catgttatgt gagtgctgtt tgagttctga 1200 
atctctgtaa gaccacctta catgctggtc 1260 
cacaccctct ttgataagaa gtgtttagct 1320 
StgtSSgttg gcccatgaca gtgggaagaa 13 80 
taaacaaact ctgtagcctt tgaaagtgga 1440 
tggcttgcag atgagatctt ctggctcacc 1500 
tctggatttc ctaggacctg tagtttccat 1560 
cactactggt caagcaatac tcagaaattc 1620 
aatttaggtg agctatccag agctttcaac 1680 
acaaaaaccc ttaggacttc tcatactcta 1740 
ctcctaagac ccttaaaata atattacaat 1800 
aatacctctg gctagcatta cttccaaatg 1860 
ttagtttctt gtctttcaac attctgccat 1920 
ttattgggaa cctgcaaaaa aaaaaaaaaa 1980 
gttatttttg atagtttaag agaattataa 2040 
attctgtgct agaatgggac ttctaaaatt 2100 
ccaaattcat aggtttaagt ggcttgtctg 2160 
ttcagaatag aatagagttc ttttttttct 2220 
ttcttcatgg ttgagcagct tttggcaaaa 2280 
tgttaataga tgtaagaaaa aaagtgtgtg 2340 
ttaaaatgaa ggaatgctga gtttgtttcc 2400 
tgctattaca cattgtgaat ttataaaagg 2460 
tccccttctt tattcctcag agcatctcaa 2520 
ccttgatcaa gtttacaact ctttgagaag 2580 
tctattactg tggtaccatg tagtgtgtaa 2640 
ttgctgttta gagctatact taaggtatag 2700 
cagtattgtg tttaattttg caggtttttc 2760 
gatatattga tattacattt taataatgct 2820 
cttttgtaac agccctgtga gacagacaat 2880 
tggaggctct gaaaagtttt tggtgatatt 2940 
ccagaattta gttgcagaac ttctgactcc 3 000 
ttcttactag ctttttgcta gctttttatt 3060 
ataattttgg cttattatca aatatcattt 3120 
actctcattg tagccatccc aaagaaaacc 3180 
aggtaactga agtgtatttc cagtacaatt 3240 
gtaactgctt acataactct ttgaaaatgt 3300 
aattcaaaag taaaaaagaa tattcgaata 3360 
ctgttcctta gctaacttgc tttgacaacc 3420 

3422 



<210> 13 

<211> 5791 

<212> ADN 

<213> Homo sapiens 
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<400> 13 

ctaatattat tggccagtct gtggaagaag ctatcagagg ggtgtctgat gcttccctca 60 
aaatggctgg ctcctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 120 
ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 180 
actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 240 
ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 300 
ctgacatatc aggaggtggc catccttacc tgacaggctt ggcagtggcc ggtggagcat 360 
actacctagg cctggaagga gcaatcatcg gtcctattct tctctgcata cttgtggttg 420 
cttccaatat ctatagtgcc atgctagtga gtcccacgaa ttcagttccc acgccaaacc 480 
agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 540 
cttcagtagg ttgatgtggt ttcctctgca gtgatttttc taggaagttc aaatttgaca 600 
gcgagttcag ctcagctgtg gccntctgcc cttccagctg tgcctagcaa gcaaaaccca 660 
ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc 720 
tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcac 780 
ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 840 
atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 900 
ctctaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 960 
tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1020 
tgtagttgag tgagcaggaa aaatgaatct tctacccttc tcccacaatg tattatacgc 1080 
tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttc 1140 
tatattataa ccctgggaga tacaaagact gaagctcttc ctcctcttcc ttttctcttc 1200 
acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaatac 1260 
ttattaagct gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1320 
ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 1380 
atccgtttca ttatttggaa ctctgccaat aagttagttt tcagcagaat tttgtattta 1440 
tgtagtattt tcccatctcc tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1500 
tgaattgaat tgcagcttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1560 
cattttacaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1620 
agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1680 
accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1740 
gcagattctg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttang 1800 
agattggtgt tgctatccat ttgttgtgaa tgaagacttg tcctatagta catgacaggg 1860 
ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1920 
ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 1980 
gtggctcaca tctgtaatcc cagcactttg gaaggctgag gtgggtggat tgcttgagcc 2040 
cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2100 
aaaaaaaaaa aaattagctg ggcacggtgg tgtggctata gtctgagcta ctcaggaggc 2160 
tgatgtatga ggatcacctg agtccaggag gtcgaggctg cagtgagcca agatggcgcc 2220 
actgcactcc agcctgggtg agagagtgag acactgtccc aaggaaaaaa aaaagtgttg 2280 
9ggggtagtt cttaagcgtt gaagatttcc cttttggaaa gtatttaaag gtagaaatat 2340 
taataatttt tcctaaaaca tctccctaag aagtcactga taattataat tagtttaaat 2400 
ttattcttac actacttaag aaaaatttca tttagaaaag gctaccatga gatcttttga 2460 
ctatatggag tagactgcat acagatctct ttatttctat tatgaatatt ttagcgatta 2520 
taatcagcca ttccactgag tattagattt ggtcactaag taactcatgt ttttctttag 2580 
tcaatcattc attcattcac taaaacattt gttgagagtt ggctaaactc tagattctgt 2640 
gccaggcact gtacagggtg acggagatca ctcataagaa ggcctcttgc cctcagccag 2700 
atcatatgta atactaaatt taaatttttt gcattaaaag gctaaaaaat catttgtttt 2760 
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tgttaattat atactggttg atttatagat gtaattagca catattcata agagacaaat 2820 
atatacaatg agttactata catatacaaa gtgattttag ctgtataaag tgatattgca 2880 
aaaaactaca gctaatgctt cttgctgggt aattattagc ataaatatca ggttcttaga 2940 
ggtctttaag agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct 3000 
gaaataccag gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc 3060 
tgccccattg ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt 3120 
ggaaccctcc gagccagaaa gaagcattcc agcatgattc ctcagatgca atgaggaagg 3180 
tttacagaat tttcacaggg caacagagat caagtggtat gaaaaggtag gagttttaag 3240 
ctcaagtctc aaagataacc tacctttaca ttctcagtca gaatttgacc cagaaagagg 3300 
aagtttcttc aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga 3360 
gtacagaact tggtcataat atcttgcatt ttatagattt attaaagatt agtttcaagt 3420 
tcacattcgc tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc 3480 
acacaggtat gctcctctct tttctgagag agaaggcatg ggattttcag cataaattcc 3540 
atgttatgtg agtgctgttt gagttctgaa gttcctatca atatctgttc ctgcaagtga 3600 
tctctgtaag accaccttac atgctggtct tagttattgt taaaattgca aggtttcttc 3660 
acaccctctt tgataagaag tgtctagctg gcagagcttt cccttgactt ctgagtctag 3720 
tgtgggttgg cccatgacag tgggaagaaa tccaacatgt tacatggaga ccttgtatgt 3780 
aaacaaactc tgtagccttt gaaagcggaa ctgcttttta cagttaaagg gctgctaaat .3840 
ggcttgcaga tgagatcttc tggctcacct tgatcttcac atgaacccat tgtgacctat 3900 
ctggatttcc taggacctgt agtttccatt tgggttatat tagtgcctca ggaatgtgtc 3960 
actactggtc aagcaatact cagaaattca ggctgtgagg ggttagatta gaggaaagta 4020 
atttaggtga gctatccaga gctttcaacc tcagggttta taggaaaaaa aaacaaaata 4080 
caaaaaccct taggacttct catactctag ccctgacctt gcagtctcct ctgaggggcc 4140 
tcctaagacc cttaaaataa tattacaata ggactttgag tgtgcatttc acatgtggaa 4200 
atacctctgg ctagcattac ttccaaatgc tagttccagc taaaaacaag tactttttat 4260 
tagtttcttg tctttcaaca ttctgccatc aaaatatatt cattttatta acttaccgat 4320 
tattgggaac ctgcaaaaaa aaaaaaaaaa acacacatgc tgtctgcagc cactgtttgg 4380 
ttatttttga tagttcaaga gaatcataaa tcaagttgtt ctgtctacta gagtcagaaa 4440 
ttctgtgcta gaatgggact tctaaaatta ggtggtcctg tcactttcta gagaaagacc 4500 
caaattcata ggtttaagtg gcttgtctga catacacata cagccagtta gtaacagaat 4560 
tcagaataga atagagttct tttttttctg tcagtccgtt gttctacttc tctttccttt 4620 
tcttcatggt tgagcagctt ttggcaaaat gtgttccata tagcagtagt tccaagagat 4680 
gttaatagat gtaagaaaaa aagtgtgtgt gtgttggggg tgggggattg catggtcaat 4740 
taaaatgaag gaatgctgag tttgtttcct tactgtagga cttctaagag ttttgaacat 4800 
gctattacac attgtgaatt tataaaaggg gacaaacact gtttgacctt agactgcact 4860 
ccccttcttt attcctcaga gcatctcaaa ggactacagg gtcctttgag aaacatggcc 4920 
cttgatcaag tttacaactc tttgagaaga catccctaat ggaaatactg aatggcagat 4980 
ctattactgt ggtaccatgt agtgtgtaat aaatcttgaa gtccagaaag caagtatatt 5040 
tgctgtttag agctatacct aaggtacaga gattcttttc cacctgtggt gtgtaaaatc 5100 
agtattgtgt ttaattttgc aggtttttca aggatcaact aatgtgcaaa tacagtggtg 5160 
atatattgat attacatttt aataatgctt ttgtatggca ctttatagtt ttcagacacc 5220 
ttttgtaaca gccctgtgag acagacaata ttatccttat tgtacagatg ggggggctct 5280 
ggaggctctg aaaagttttt ggtgatattc ccctaagttt ataccacaaa atgatggagc 5340 
cagaatttag ttgcagaact tctgactcca agtccagagt tctttactag acatctggtt 5400 
tcttactagc tttttgctag ctttttattt tacagtgaaa agtatggaag caaatcctga 5460 
taattttggc ttattatcaa ataccattta ttttttattg cagagaccca gcagatgtaa 5520 
ctctcattgt agccatccca aagaaaaccc ttctttgccc tttgcagtgc cacttattta 5580 
ggtaactgaa gtgtatttcc agtacaattt gattttgaac taagatttga tatagagttg 5640 
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taattgctta cataactctt tgaaaatgta tcatccctgg gttctcaggt gaaggaggca 5700 
attcaaaagt aaaaaagaat attcgaatac aataaatacc ctctgttctc acacaaatgc 5760 
tgtttcttag ctaacttgct ttgacaacct a 5791 



<210> 14 
<211> 2615 
<212> ADN 

<213> Homo sapiens 
<400> 14 

acccaaactt caaaactggt caataattaa caatgtatta attttgaaaa gtttttaact 60 
gtaagagtat caaatataat acagagctct taaatactta aagctttctg tcacaatatt 120 
aaaaataaaa cttcttagca ttccaagact atgaaaagtg ccccctccca attttttaag 180 
caagtaatag tatctgctgg tgtttatatt tgttaaaaat ttaaaataac aacaacaaaa 240 
aaaaaacttc taacttgaat gtgatgtgac ttgagtactt ctaaaccatc gaaaatacct 300 
gatacgggga gtaggttcat ggttttggta aaagaaacta tgtcacagag ttttaatatt 360 
ataactggac ttctaaatca taaagtaaga aaattaacat catttagtat cttttcttgt 420 
ttgtttttta ttttgctaag aaggaaccag attttatatc atcattcttc atctaaatgg 480 
actgccatat gaagttctgg tttctctgtt tcttcttggt tagctggtta ctaccaaatg 540 
cctaaggaca attctcagag catttccaca tgaaggtgat tagttttcat ttaataaaat 600 
taataacaca ttacatgtag atgaaaatat aacaaaacca tacgaaagct tgtcagagat 660 
attcaactag aaaactaaaa cagtagccac tagaaaaaag acatagtgga aaaatttttg 720 
aacggatatg ctttttgttg aataattaca gtaattacta ccaatatatt cagaccaaca 780 
aagattagaa agaacatgca aaatgctgag aaaatttctc ctacaattaa aacaaatgtg 840 
tttttatgag agagaaaaaa ataagtcaag ctcctaaaat gaaaattaca aaacatagga 900 
ttaacaattt attaaaaatt acacccttga tttttttgag gccaaaaaaa gtagtttttt 960 
taaaacaagg gcatgaaaaa gacttcagat taagactcat actctgttct aaatgaaaag 1020 
tagtaaaact acttctagta gaaaatacct gctatggaaa aaaaatttca gatattttcc 1080 
atttgatgta ggtattaata aaaaatatga tgtttatatc taaaatataa actagcaatt 1140 
tattttcatt tataatataa agtgttttag gaaaagttta ctcttctcag tgttcaaaat 1200 
aaaataggaa ttgttctcca tacctagcaa ttttaatgat aatgtcaagt aaaaatttaa 1260 
ttctgctgaa ctaaagctca aatagattca aattttaaaa atatgaaaaa tctacatttt 1320 
taaaagctta aaatttttgt tactttgcaa tgacagatct gctttttcta acatttaaaa 1380 
aattttgtct tcttttatta atataaaact attcaaataa tcacaacaga atctcttata 1440 
ccggtaaagc ataatcacat gatacactcg taacactcta caaatacaat ccagaaaggg 1500 
gaagtctccc tcaaacaaag aatttctttc tttctgtcac ctccattcca tatatatagt 1560 
cttcatttca catcacatac atagaaaaat tagcacaata taacaggtag ataagaaaaa 1620 
aaatttttgg ccttgtagag ctcatcacgt aaatttattc attcttctta gtatgtttct 1680 
ttttaacatt atctgaggca acatctaccg gctttgaggc caatgaccca acgccattgg 1740 
aaggtgactt tgcttcactt ttcttctcac atgatgaaaa cggctgctgc cagccaaata 1800 
gcatccaact caatgtatcc tcaaaaggag caaatgtcat agtagaagtc tgtgtagtca 1860 
tcatggttat ctttgtggcc acaataaaga tggtataaag gaacataaga ttatgctttg 1920 
atattgccag atgctgggtg tgctggaatg tgaagataac tgaccccagc agggttacct 1980 
tggcagggta tgacatcttc agccattcat caccttctgg tttccaatct ccttttacca 2040 
acctctcaaa attcgttata atggtaccac ctgcacctcg ggcccatcca atagctatca 2100 
tgactatcca gccatttttg taatagctat tagcatgtgt gactccacct actattttcc 2160 
aagttctggt cacttccttc attcccgaag ccagtagttg aacaggtaga tatgaatagc 2220 
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cctgggaaac taggtcatgc gggcaaaaaa 
atatgttagt gtggtttgca agaaacttca 
aaattcctcc accaaaacag tggagcatag 
atgccaatgc agctgctccc ggctgacgtt 
cgatgtcaaa aaagggaaac atggacgtgc 
gagaatccat aacgaccacc gaccgcggca 
cgctcgcgcg gtgaggagta ggagagggca 



atgtaatata ccagattgaa gatgccagta 2280 

atggaggctc tgcaagcagt agacaggata 234 0 

cagtaaacca gcttgaaata ggattcttcc 24 00 

tcaccgccat cactgacact agatagtgcg 2460 

gggagaaggc cagagccaac tcgtcccatg 2520 

accgaagcag ccgcggctac tggttccccg 2580 
cagcc 2615 



<210> 15 

<211> 2551 

<212> ADN 

<213> Homo sapiens 

<400> 15 

ggctgtgccc tctcctactc ctcaccgcgc 
tcggttgccg cggtcggtgg tcgttatgga 
ctcccgcacg tccatgtttc ccttttttga 
ggtgaaacgt cagccgggag cagctgcatt 
tactgctatg ctccactgtt ttggtggagg 
tccattgaag tttcttgcaa accacactaa 
tacatttttt tgcccgcatg acctagtttc 
actggcttcg ggaatgaagg aagtgaccag 
tgctaatagc tattacaaaa atggctggat 
tgcaggtggt accattataa cgaattttga 
aggtgatgaa tggctgaaga tgtcataccc 
cttcacattc cagcacaccc agcatctggc 
taccatcttt attgtggcca caaagataac 
atttgctcct tttgaggata cattgagttg 
atcatgtgag aagaaaagtg aagcaaagtc 
aaagccggta gatgttgcct cagataatgt 
aatttacgtg atgagctcta caaggccaaa 
tgctaatttt tctatgtatg tgatgtgaaa 
agaaagaaag aaattctttg tttgagggag 
tgttacgagt gtatcatgtg attatgcttt 
tgaatagttt tatattaata aaagaagaca 
tgtcattgca aagtaacaaa aattttaagc 
aaatttgaat ctatttgagc tttagttcag 
taaaattgct aggtatggag aacaattcct 
ttttcctaaa acactttata ttataaatga 
aaacatcata ttttttatta atacctacat 
atagcaggta ttttctacta gaagtagttt 
tcttaatctg aagtcttttt catgcccttg 
aaaaatcaag ggtgtaattt ttaataaatt 
aggagcttga cttatttttt tctctctcat 
attttctcag cattttgcat gttctttcta 
attactgtaa ttattcaaca aaaagcatat 
ttctagtggc tactgtttta gttttctagt 



gagcgcgggg aaccagtagc cgcggctgct 60 
ttctccatgg gacgagttgg ctctggcctt 120 
catcgcgcac tatctagtgt cagtgatggc 180 
ggcatggaag aatcctattt caagctggtt 240 
aactttatcc tgtctactgc ttgcagagcc 300 
catattactg gcatcttcaa tctggtatat 360 
ccagggctat tcatatctac ctgttcaact 420 
aacttggaaa atagtaggtg gagtcacaca 480 
agtcatgata gctattggat gggcccgagg 540 
gaggttggta aaaggagatt ggaaaccaga 600 
tgccaaggta accctgctgg ggtcagttat 660 
aatatcaaag cataatctta tgttccttta 720 
catgatgact acacagactt ctactatgac 780 
gatgctattt ggctggcagc agccgttttc 840 
accttccaat ggcgttgggt cattggcctc 900 
taaaaagaaa catactaaga agaatgaata 960 
aatttttttt cttatctacc tgttatattg 1020 
tgaagactat atatatggaa tggaggtgac 1080 
acttcccctt tctggattgt atttgtagag 1140 
accggtataa gagattctgt tgtgattatt 1200 
aaatttttta aatgttagaa aaagcagatc 1260 
ttttaaaaat gtagattttt catattttta 1320 
cagaattaaa tttttacttg acattatcat 1380 
attttatttt gaacactgag aagagtaaac 1440 
aaataaattg ctagtttata ttttagatat 1500 
caaatggaaa atatctgaaa ttttttttcc 1560 
tactactttt catttagaac agagtatgag 1620 
ttttaaaaaa actacttttt ttggcctcaa 1680 
gttaatccta tgttttgtaa ttttcatttt 1740 
aaaaa'cacat ttgttttaat tgtaggagaa 1800 
atctctgttg gtctgaatat attggtagta 1860 
ccgttcaaaa atttttccac t-atgtctttt 1920 
tgaatatctc tgacaagctt tcgtatggtt 1980 
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ttgttatatt ttcatctaca tgtaatgtgt 
cttcatgtgg aaatgctctg agaattgtcc 
gaagaaacag agaaaccaga acttcatatg 
aaaatctggt tccttctcag caaaataaaa 
aattttctta ctttatgatt tagaagtcca 
tcttttacca aaaccatgaa cctactcccc 
ctcaagtcac atcacattca agttagaagt 
taacaaatat aaacaccagc agatactatt 
ttcatagtct tggaatgcta agaagtttta 
atttaagagc tctgtattat atctgatacc 



tattaatttt attaaatgaa aactaatcac 2040 

ttaggcattt ggtagtaacc agctaaccaa 2100 

gcagtccatt tagatgaaga atgatgatat 2160 

aacaaacaag aaaagatact aaatgatgtt 2220 

gttataatat taaaactctg tgacatagtt 2280 

gtatcaggta ttttcgatgg tttagaagta 2340 

tctttttttg ttgttgttat tttaaatttt 2400 

acttgcttaa aaaattggga gggggcactt 2460 

tttttaatat tgtgacagaa agctttaagt 2520 

c 2551 



<210> 16 

<211> 775 

<212> ADN ■ 

<213> Homo sapiens 

<400> 16 

tctatccgtc cgcgtcagcg ccttgccacc 
agtggcacta acgtgggatc ctcagggcgc 
gcgggatcca ctgtccggca gaggtaagga 
agataggacc cagaacctcg ctgattctgg 
aaggcaaaat gagcttctag tgacgtggcc 
aggcgacatt ttttttctcg ttgctcagtt 
acaaactgga atagagtcag agataacttt 
ctggacctga ggtttgcact cacatttcca 
agataactcg tcctacacaa aacttagtct 
atatctcctt acttccatat ggcactgttg 
agcgtcatct tggatttttc ttatgctctt 
ctctgcttga aagctttctc ataagctctt 
ctacttaacc cttttcttca ggctgtttgc 



ctcatctcca atatgcctgg tccgaccccc 60 
tctcccagca aagcagtggc cgcccgggcg 12 0 
accctgcagt tcgttcgctt ccagactcgg 180 
ggtggagacc ctagcatgtg aagattgaca 24 0 
gtgggagtag ttaaaggcct tttgggagga 300 
tagggcacta ctcttaaaaa aggaaagtta 360 
gagaaaaccg atgtcattaa actggtgtct 420 
tctggcggcc ccataagcaa tctgtcctac 480 
cttttcagct cagctctctc actctcaatt 540 
tacactcatt tactcagagc cagaaacgtc 600 
tctctctcta gtcatatgcc agactttaaa 660 
tccttttccc tttctactgc tttgcatttg 720 
tttccagtcc atcgttcgct ctgct 775 



<210> 17 
<211> 491 
<212> ADN 

<213> Homo sapiens 
<400> 17 

ccctcctttc ccaccagaca ctcccttaca 
ttcaaactta acacccaggc aacacttatc 
cagggctaat gtggaagaga aaaccaggcc 
ttacctcaaa ggccgtttgt caacaacccc 
ccnnggtggg accacggact caaggatagc 
gcccaggcaa cactcccgca tgcctcccat 
ccagccaaag ttgnaaatgg ggtttnttta 
tgnnngctnt ggnagggaan gtcantttcc 
tttgcaagtg g 



ccatgcacat ttatttaatn atgtacttaa 60 
ctaaactatg tgctttcctt aagaagttcc 120 
tggnagatcc agtttcaaaa atnccagaga 180 
agctattact gagatggagg ccaccatgct 240 
cactggaaac aaggacacag aggaccttgt* 300 
tccaaggttc cctttttang cccctctctt 360 
nggcactagc cttgggntat ttttacccnn 420 
tttcactgnn tctcaccttt gttacctggc 480 

491 
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<210> 18 
<211> 293 
<212> ADN 

<213> Homo sapiens 
<400> 18 

caccatgcac atttatttaa ttatgtactt attcaactta caccaggcac acttatctaa 60 
ctatgtgctt tcttagaagt tccagggcta atgtggagag aaaccaggcc tggagatcca 120 
gtttcaaaat tccagagatt acctcaaggc cgtttgtcaa caacccagct attactgaga 180 
tgaggccacc atgctccagg tggaccacga ctcaagatag ccactgaaac aagacacaga 240 
gaccttgtgc ccagcaacac tcccgcatgc ctcccattcc aaggttccct ttt 293 



<210> 19 
<211> 2442 
<212> ADN 

<213> Homo sapiens 
<400> 19 

tatgtgggat tttagggcaa ggattttcaa cagtcaacag tactggaagc tgaggcttca 60 

gaacccaggt atggaaggca gggagtttga actatgctcc Ctgcacagaa tgggaagcca 120 

ggaaaatgca aatgtcaaac tatcctacag ggaagtctct ataaacctcc acagaactcc 180 

cacaaaagac acacttaggg aaaaggtatg cagcccaaaa tatacaagtc tgttcaactt 240 

gctccctaaa ataagggaga atgccgacac cgcaggaaaa aggagctaat ggaactaaca 300 

agaactttaa agaaacacca ataaaccaag aacacgcgaa aatgacaaaa taccaaataa 3 60 

aaatccaaaa tagaaacaaa tccaaaagaa aacaaaagtt gatgaaataa aatctcagta 420 

ggaggattaa gtaaaagaat tagcaaattg aaagattttt aagagacgaa gacagaataa 480 

aaagctccct atgtttaaaa ggagttttta gaagaaaata gaaacaatgg gggaagatgg 540 

ttaaaaatta ataataactt tccagacttg aagaaaaaaa actgaatctt cacattacag 600 

aagcacacta tgtctagggc aggataaata acaaatctac actaggacac atcctgatct 66 0 

gcaacacact gaagataaag agagaacagt aaaaatatag attactacct gtaagattac 720 

tacccacaaa ctaagagggc tcagactaac agcagatttt ttcattagtt aacactgagg 780 

caaggagaca atagaacagt atcttcaagg cacagcagac agtactaaac aactcaactc 840 

ggtcaaacct aactttctgg ccagcacttg tgaaatcaaa ggctccccag taatttgatt 900 

agcactttca tcattttgta atcttataaa caccttctcc agtggggaag aaatagccca 960 

aatgggaatt ttaggtacct aagacttcgg ctgccaactg tgcctaatat cctagtaatg 1020 

ttaacctttc cagtacccag tatagaatac ccctacaact gggcatttta aacaggcaaa 1080 

caagtattac acacacttaa ttttgttcat tccagccaca tgaagtcaaa ggatgtttct 1140 

ctataagaaa ctacaataga tctttgaaac tttgcatgaa . gttgttttag gggccatact 1200 

tcaagtgaca ggaaataaca aatagcaata cacacacatt tcattaagtg gggatcttat 1260 

aaaatctcta gaaccctgag aagttccttg ctacttataa agccttttct tgacctgtca 1320 

gacctaatgt ttgatgatgt ataagaaaac tatcgtcgaa tttatgttat gcataaattt 1380 

tatagtatat ttaaagtgaa atacacaatt tttttctatg cacatactct tactggaaaa 1440 

aatttgaatg ctgacaataa aatggctaag ttatggtaca tgcatgtaac agaatactat 1500 

agagcagact gagcaaacta tggccacagg ccaaatccag cccatggtaa gtatttgtaa 1560 

atagttttac tggaacacaa ttatactcat ttatttacat attatctatt gatgctttca 1620 
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cactaccgtg gtagtgctga gtagccatga 
tatttactaa ctaacccttt atagaaagaa 
aacgaatgaa atacagctga atgagtcaac 
aatcaaatca caaaaaatac atgcagtata 
aaaacaaacc tgatactgtt cacaaatgca 
aagttgatca acaccaagtg atctggggca 
agggtacatt aacagtatat gtgctgatga 
atggaggttc agtttataat taccttttaa 
atatgtattt tcatgtcatt taaaagttca 
ttaacagcag gtgacagaat atttgccaac 
gaacttttaa tgggcacaca aataagaaca 
aaaatcttcc caactacgct aaaagctcta 
ctaattaaaa gcactagcat cttagaagaa 
actctggcta gccctaatga agctcaaaac 



cagagaccta atggtctgca aaacctaaaa 1680 
ctttgctgaa ccctggtatg gagaaataaa 1740 
ttcaatcaat ctcaaaagca atgctgagag 1800 
attcccatta caaaaaatcc acaaatatgc 1860 
cataaaacca tttttttttt taaggtaatg 1920 
9*ggggtacg tagaagacat ttaactgtgc 198*0 
tattctatat ccgaacctgg ggttggttaa 2040 
actacataaa tgttttttta tacattcagt 2100 
aaaaagacca aaaaggcaca tatcaaaaca 2160 
ctgttagcag gttttaaaac cttctacaat 2220 
caagcataaa atacttttta aaattaaagt 2280 
gcctgaatat tttatatacg agcaaaagta 2340 
tttccttaaa tccaagattt taaaattccc 2400 
aaaatacaaa gg 244 2 



<210> 20 
<211> 4608 
<212> ADN 

<213> Homo sapiens 



<400> 20 

ctcaaaacac actttccccc atgcccccgt 
agcctccggt accatgcttc ttaccgtgat 
attggtcaac atatgagtcc tgaggggtgc 
cacaacaggc agctcctcag gcccaactct 
gaggactcga ggcaagagag ccaggatgga 
ataacagaga cagaaatgag tcagtgagca 
ttcccccaaa gtgaaatgtc cttttaagga 
gccaaatcaa gaacgcaatc tcacttacaa 
atctaaccaa ggaggtgaaa gatctctaca 
tcacagatga cacagataaa tggaaaaaca 
ttgttaaaat ggccacactg ctcaaagcaa 
taccaacatc attcttcaca caattaaaaa 
aaagccagaa tggccaaagc aatcctaagc 
aggctacagt agccaaaaca gcatggtaat 
gaacagaaaa gagaacccag aaataaagcc 
aggtgacaaa aacaagcaac agggcaagga 
ttggctatcc ttttgtagaa gaataaaaat 
ttaactcggc caggcgcggt ggctcacgcc 
aggtggatca cgaagtcaag aaatcaagac 
ctactacaga tacaaaatta gccaggcatg 
ggaggctgag gcaggagaat tgcttgaatc 
cacaccactg cattccagcc tggcaaaaga 
tcaagataga ttaagaattc attactaagt 
acaagtgggc cctaattaaa cttaagaaca 
gtgtttttca ctaacattta ggctaagagc 
ttatggagca aaatgtttat ggtagagaca 



cataaattca ttcttatgct aatactgcaa 60 
attcttgatg atctgctgca ccaagatcgc 120 
atgctgaagc agcagtcgaa gcagctggcc 180 
gttcacccgc aggctctgca gcatcaacct 240 
gacacagacc ccccacagct tgtccctaca 300 
aatgcccaca ggaaaagccc cccttctata 360 
acatgttttc caataacatt taaactgaga 420 
tagccacaca cactaaatac ctaggaatac 480 
agaaaaacta cagaacactg ctgagagaaa 540 
ttccatgctc atgaattgga ataatcagta 600 
cctacagatt caactgtatt cctatcaaac 660 
aaaatattct aaaattcaca tggaaccaaa 720 
aaaaacaacc tgacttcaca gtacactaca 780 
gatagagaac aacagacaga taaaccaatg 840 
acatacctac aactatctca tcttcaacta 900 
ttccctattc aataaatggt gctgggacaa 960 
ggatccctat ctttcatcat atacaaaaaa 1020 
tgtaatccca gcactttggg aggctgaggc 1080 
catcctggcc aacatggaga aaccccgtct 1140 
gtggcacgcg cctgcagtcc cagctactcg 1200 
cgggaggtgg aggttgtagt gagccgagat 1260 
atgagactcc gtctcaaaaa aaaaattaac 1320 
cctcaaaagc aattgcaaaa acaaaaaatg 1380 
agagaaacta tccacatttc aataaacatg 1440 
caaatcaaga acatcattct ctcggtatct 1500 
ggtgacctcg cagctagcct aaccacattc 1560 
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tccaagtgtt aattagatgg tgcaatattc acatagacct agagtccact gactatgaaa 1620 
ggctctgacc tttttgcagc ttctttacca ggagtgtata atcttcctag ttcctaaatc 1680 
tttctaagag aacctgacta cctccaggtc tagagggagc agccccttca ctatataacc 1740 
aatttccctg actgcacata tggtaattcc atctatggtg aataatgaat ccattctagg 1800 
ccaaatagat actcttatgc agagcccagc tgggacagtc acgtgcaagg agaaaagaga 1860 
aagccagact gcagacatag ctaatgcaaa ggcacggaga tacagactac acaaactaga 1920 
agaaacgtag agtaagctgc tttgtctctt gctaaatttc taattcctag cccttgggtt 1980 
ttacaagtta ctcctgtaat aatcaaatat tttcattttc tacttttctt aatttgagtg 2040 
gatttcaaat aaccacagac cttaaaaaaa aaagacagcc aagctcaagg ccagatgggt 2100 
aaaacctcta ggtgaaagaa actataatga aattcatata aagatatcca acagtcataa 2160 
aaactgtatg tgggatttta gggcaaggat tttcaacagt caacagtact ggaagctgag 2220 
gcttcagaac ccaggtatgg aaggcaggga gtttgaacta tgctccttgc acagaatggg 2280 
aagccaggaa aatgcaaatg tcaaactatc ctacagggaa gtctctataa acctccacag 2340 
aactcccaca aaagacacac ttagggaaaa ggtatgcagc ccaaaatata caagtctgtt 2400 
caacttgctc cctaaaataa gggagaatgc cgacaccgca ggaaaaagga gctaatggaa 2460 
ctaacaagaa ctttaaagaa acaccaataa accaagaaca cgcgaaaatg acaaaatacc 2520 
aaataaaaat ccaaaataga aacaaatcca aaagaaaaca aaagttgatg aaataaaatc 2580 
tcagtaggag gattaagtaa aagaattagc aaattgaaag atttttaaga gacgaagaca 2640 
gaataaaaag ctccctatgt ttaaaaggag tttttagaag aaaatagaaa caatggggga 2700 
agatggttaa aaattaataa taactttcca gacttgaaga aaaaaaactg aatcttcaca 2760 
ttacagaagc acactatgtc tagggcagga taaataacaa atctacacta ggacacatcc 2820 
tgatctgcaa cacactgaag ataaagagag aacagtaaaa atatagatta ctacctgtaa 2880 
gattactacc tacaaactaa gagggctcag actaacagca gattttttca ttagttaaca 2940 
ctgaggcaag gagacaatag aacagtatct tcaaggcaca gcagacagta ctaaacaact 3000 
caactcggtc aaacctaact ttctggccag cacttgtgaa atcaaaggct ccccagtaat 3060 
ttgattagca ctttcatcat tttgtaatct tataaacacc ttctccagtg gggaagaaat 3120 
agcccaaatg ggaattttag gtacctaaga cttcggctgc caactgtgcc taatatccta 3180 
gtaatgttaa cctttccagt acccagtata gaatacccct acaactgggc attttaaaca 3240 
ggcaaacaag tattacacac acttaatttt gttcattcca gccacatgaa gtcaaaggat 3300 
gtttctctat aagaaactac aatagatctt tgaaactttg catgaagttg ttttaggggc 3360 
catacttcaa gtgacaggaa ataacaaata gcaatacaca cacatttcat taagtgggga 3420 
tcttataaaa tctctagaac cctgagaagt tccttgctac ttataaagcc ttttcttgac 3480 
ctgtcagacc taatgtttga tgatgtataa gaaaactatc gtcgaattta tgttatgcat 3540 
aaattttata gtatatttaa agtgaaatac acaatttttt tctatgcaca tactcttact 3600 
ggaaaaaatt tgaatgctga caataaaatg gctaagttat ggtacatgca tgtaacagaa 3660 
tactatagag cagactgagc aaactatggc cacaggccaa atccagccca tggtaagtat 3720 
ttgtaaatag ttttactgga acacaattat actcatttat ttacatatta tctattgatg 3780 
ctttcacact accgtggtag tgctgagtag ccatgacaga gacctaatgg tctgcaaaac 3840 
ctaaaatatt tactaactaa cccttcatag aaagaacttt gccgaaccct ggtatggaga 3900 
aataaaaacg aatgaaatac agctgaatga gtcaacttca atcaatctca aaagcaatgc 3960 
tgagagaatc aaatcacaaa aaatacatgc agtataattc ccattacaaa aaatccacaa 4020 
atatgcaaaa caaacctgat actgttcaca aatgcacata aaaccatttt tttttttaag 4080 
gtaatgaagt tgatcaacac caagtgatct ggggcagagg ggtacgtaga agacatttaa 4140 
ctgtgcaggg tacattaaca gtatatgtgc tgatgatatt ctatatccga acctggggtt 4200 
ggttaaatgg aggttcagtt tataattacc tttcaaacta cataaatgtt tttttataca 4260 
ttcagtatat gtattttcat gtcatttaaa agttcaaaaa agaccaaaaa ggcacatatc 4320 
aaaacattaa cagcaggtga cagaatattt gccaacctgt tagcaggttt taaaaccttc 4380 
tacaatgaac ttttaatggg cacacaaata agaacacaag cataaaatac tttttaaaat 4440 
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taaagtaaaa tcttcccaac tacgctaaaa gctctagcct gaatatttta tatacgagca 4500 
aaagtactaa ttaaaagcac tagcatctta gaagaatttc cttaaatcca agattttaaa 4560 
attcccactc tggctagctc taatgaagct caaaacaaaa tacaaagg 4608 



<210> 21 
<211> 1627 
<212> ADN 

<213> Homo sapiens 
<400> 21 

gaatgctgtt acctgaaccc cttacttcga aggatcataa gattcacagg ggtgtttgca 60 
tttggacttt ttgctactga catttttgta aacgccggac aagtggtcac tgggcactta 120 
acgccatact tcctgactgt gtgcaagcca aactacacca gtgcagactg ccaagcgcac 180 
caccagttta taaacaatgg gaacatttgt actggggacc tggaagtgat agaaaaggct 240 
cggagatcct tcccctccaa acacgctgct ctgagcattt actccgcctt atatgccacg 300 
atgtatatta caagcacaat caagacgaag agcagtcgac tggccaagcc ggtgctgtgc 360 
ctcggaactc tctgcacagc cttcctgaca ggcctcaacc gggtctctga gtatcggaac 420 
cactgctcgg acgtgattgc tggtttcatc ctgggcactg cagtggccct gtttctggga 480 
atgtgtgtgg ttcataactt taaaggaacg caaggatctc cttccaaacc caagcctgag 540 
gatccccgtg gagtacccct aatggctttc ccaaggatag aaagccctct ggaaacctta 600 
agtgcacaga atcactctgc gtccatgacc gaagttacct gagacgactg .atgtgtcaca 660 
agctgttttt taaaatcatc ttccaattct atacttcaaa acacacagtt gctcaatgtc 720 
aaactgtgat gacaaatatt acgtttatct agttagaagc taatgttttg tacatttttt 780 
gtatgaggaa gtgatgtagc ttgccctgat tttttttttt tttttggtca gctttaatat 840 
atttatgcca gaattttaaa accaacaaaa ttttcttgtt caagcgtgca ttgaagaacc 900 
acacttactc aatggttgac gttgttttgt gatatttgta cacaaatttt cttttctcag 960 
ttttataaac acagaatata acaattcact ttaaactttt attaccacag ttgctgcctc 1020 
ctccagaatt tttgaatttt aataaaaggc aaacttttga gctgcaggaa ggacaatgtt 1080 
ggttaataat aaatctcaaa gtcaattgta gaaaaaaaat tgtcttcaaa aagaatgttg 1140 
cactctgatc tcttaacaaa ttgttacgtt caaagtttaa agtgatatat taacaaagtc 1200 
acctagttat acaaacaatt gccagagaat tctggatttg gagggtattg gggttatatg 1260 
attctttctt agataatggc ctctactaaa taactcaaga tctttctgga atgtcttctg 1320 
gcaggcaggt gccactgtca gcttttctcc aaaaagcagc caacatcagc ctcccctgtc 1380 
aactcaacag ttttgtatct catattatat ggactttata tgaaaatgaa tattttacag 1440 
tttgcacagt attattttac agaaaaggaa tcagagaatc tacaacatag ggccccagaa 1500 
caacagtttc actttgtggc ttttaattat tctagaattt taactgcatc tcatttttct 1560 
agcatggtga gaactaatat gtaactcctt tgattgaagg agctcttttg tccgtaccta 1620 
tcagaat 1627 



<210> 22 

<211> 2333 

<212> ADN 

<213> Homo sapiens 

<400> 22 

attcaagaga gcaaggacaa ataatggtca aggaaggaag tcagggattg gtggctctgt 60 
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actaagtgtc agcttcaaag ggagagacca gagcataaac agacaattct ctaggttgca 120 
aattgggagg attaggaaca agtaagagag ttccatgcag gatggacaag aaaaaaaagt 180 
tttataccaa aaattgtatt tcatggcatt agggcagtct actggggtaa ggcactatgc 240 
agtactaggc aattagaatt ctattcacta gctatgtgca caagcggctc ctgacctggt 300 
cattttggct gtaaaactat tcatgcctgg acagtttttg acggtgcagt cttgctatat 360 
ggtgtgagaa atggctgtag gaaacaacac tcaacgaagt tattccatca tcccgtgttt 420 
tatatttgtt gagcttgtca tcatggctgg gacagtgctg cttgcctact acttcgaatg 480 
cactgacact tttcaggtgc atatccaagg attcttctgt caggacggag acttaatgaa 540 
gccttaccca gggacagagg aagaaagctt catcacccct ctggtgctct attgtgtgct 600 
ggctgccacc ccaactgcta ttatttttat tggtgagata tccatgtatt tcataaaatc 660 
aacaagagaa tccctgattg ctcaggagaa aacaattctg accggagaat gctgttacct 720 
gaacccctta cttcgaagga tcataagatt cacaggggtg tttgcatttg gactttttgc 780 
tactgacatt tttgtaaacg ccggacaagt ggtcactggg cacttaacgc catacttcct 840 
gactgtgtgc aagccaaact acaccagtgc agactgccaa gcgcaccacc agtttataaa 900 
caatgggaac atttgtactg gggacctgga agtgatagaa aaggctcgga gatcctttcc 960 
ctccaaacac gctgctctga gcatttactc cgccttatat gccacgatgt atattacaag 1020 
cacaatcaag acgaagagca gtcgactggc caagccggtg ctgtgcctcg gaactctctg 1080 
cacagccttc ctgacaggcc tcaaccgggt ctctgagtat cggaaccact gctcggacgt 1140 
gattgctggt ttcatcctgg gcactgcagt ggccctgttt ctgggaatgt gtgtggttca 1200 
taactttaaa ggaacgcaag gatctccttc caaacccaag cctgaggatc cccgtggagt 1260 
acccctaatg gctttcccaa ggatagaaag ccctctggaa accttaagtg cacagaatca 1320 
ctctgcgtcc atgaccgaag ttacctgaga cgactgatgt gtcacaagct .gttttttaaa 1380 
atcatcttcc aattctatac ttcaaaacac acagttgctc aatgtcaaac tgtgatgaca 1440 
aatattacgt ttatctagtt agaagctaat gttttgtaca ttttttgtat gaggaagtga 1500 
tgtagcttgc cctgattttt tttttttttt tggtcagctt taatatattt atgccagaat 1560 
tttaaaacca acaaaatttt cttgttcaag cgtgcattga agaaccacat ttattcaatg 1620 
gttgacgttg ttttgtgata tttgtacaca aattttcttt tctcagtttt ataaacacag 1680 
aatataacaa ttcactttaa acttttatta ccacagttgc tgcctcctcc agaatttttg 1740 
aattttaata aaaggcaaac ttttgagctg caggaaggac aatgttggtt aataataaat 1800 
ctcaaagtca attgtagaaa aaaaattgtc ttcaaaaaga atgttgcact ctgatctctt 1860 
aacaaattgt tacgttcaaa gtttaaagtg atatattaac aaagtcacct agttatacaa 1920 
acaattgtca gagaattctg gatttggagg gtattggggt tatatgattc tttcttagat 1980 
aatggcctct actaaataac tcaagatctt tctggaatgt cttctggcag gcaggtgcca 2 04 0 
ctgtcagctt ttctccaaaa agcagccaac atcagcctcc cctgtcaact caacagtttt 2100 
gtatctcata ttatatggac tttatatgaa aatgaatatt ttacagtttg cacagtatta 2160 
ttttacagaa aaggaatcag agaatctaca acatagggcc ccagaacaac agtttcactt 2220 
tgtggctttt aattattcta gaattttaac tgcatctcat ttttctagca tggtgagaac 2280 
taatatgtaa ctcctttgat tgaaggagct cttttgtccg tacctatcag aat 2333 



<210> 23 

<211> 2764 

<212> ADN 

<213> Homo sapiens 



<400> 23 

cagtttttat cacaggtgca agccgtggca 
aggatggagc aaatattgtt actgctgcaa 



ttggcaaagc" tattgcattg aaagcagcaa 60 
agaccgccca gccacatcca aaacttctag 120 
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gcacaatcta taccgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 160 
ttgttgatgt gagagatgaa cagcagatca gtgctgcagt ggagaaagcc atcaagaaat 240 
ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300 
acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360 
catctaaagc atgtattcct tatttgaaaa agagcaaagt tgctcatatc ctcaatatca 420 
gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgcta 480 
agtatggtat gtctatgtat gtgcttggaa tggcagaaga atttaaaggt gaaattgcag 54 0 
tcaatgcact atggcctaaa acagccatac acactgctgc tatggatatg ctgggaggac 600 
ctggtatcga aagccagtgt agaaaagttg atatcattgc agatgcagca tattccattt 660 
tccaaaagcc aaaaagtttt actggcaact ttgtcattga tgaaaatatc ttaaaagaag 720 
aaggaataga aaattttgac gtttatgcaa ttaaaccagg tcatcctttg caaccagatt 780 
tcttcttaga tgaataccca gaagcagtta gcaagaaagt ggaatcaact ggtgctgttc 840 
cagaattcaa agaagagaaa ctgcagctgc aaccaaaacc acgttctgga gctgtggaag 900 
aaacatttag aattgttaag gactctctca gtgatgatgt tgttaaagcc actcaagcaa 960 
tctatctgtt tgaactctcc ggtgaagatg gtggcacgtg gtttcttgat ctgaaaagca 1020 
agggtgggaa tgtcggatat ggagagcctt ctgatcaggc agatgtggtg atgagtatga 1080 
ctactgatga ctttgtaaaa atgttttcag ggaaactaaa accaacaatg gcattcatgt ' 1140 
cagggaaatt gaagattaaa ggtaacatgg ccctagcaat caaattggag aagctaatga 1200 
atcagatgaa tgccagactg tgaaggaaaa tataaaaaaa aagtcgactg ctatgctcaa 1260 
aaagtaaaaa aagctcaaca gttaaaatct aatgtttgtt ttctttcctg ttatattata 1320 
aggatatgca cgtttgttct ggaaaagata gaatttgtct ctaaaagact tgaaattgta 1380 
attaaaatgg caagctaatc aaacataagc ttcattaagt gggattctaa gacagtctgt 144 0 
gtttttatat ttcaagggtt taaccctttg agccttacat ctcattcact gtctttctcc 1500 
aagaaaagta ttttgggcgg acagtcagat caagcagtaa aattagctct ttcaaatctt 1560 
cttgtcatgt aaaatgaagc tagtctgttt taaaattttt agttttggat tgtatactaa 1620 
tgaaaatctt aatgatgttt ttgattttta tatacttatt ttaaagaaaa tcttatatag 1680 
tacattttac aaaaattata aaaaatgaat tagtactggc gaggactaaa tgaaacaata 1740 
atttttcatt ttgataacta gctttccagg tggacttagc cataggaaaa tattactaat 1800 
gtaatttaac aaattgctgc atgtattcca tttaaaaata tgtttaaatt gtcctaaaac 1860 
aaaataattt tctccctagg agtatgcatt tggctacagt gttttgaaac agaaacctta 1920 
gaataggtca ttggtatggg ctgaactgtg tatcccccaa ttcatttgtt gaggtcctaa 1980 
ctcccatttc ttttgaatgt gactgttcgg agatgaggcc tttaaagagg tgacttaagt 2040 
tcaaaggagg ctgttagtct aatccaacat ggtgtccttt ggacataaga gataccagca 2100- 
atgtgtgcac agaacaaaga ccaggagagg acacagtgag aaggcagtta tctgcaagca 2160 
aagagagagg cttcagaaga aacaaaatca ccagcacctt gatctttgac ttctaatctc 2220 
cagaatagtg agaaataaat ttctgttgtt aagccgtcca ctgtgggagg ccgacgcagg 2280 
aggattgctt gaggccagga gttcaaggcc agcctggaca acatagtaag accctatctc 2340 
taccccccta ataaattaat ttaaaaagcc ccccaatctg tggtatttta ttatggcagc 2400 
cctagcaagc taatacagtg gtttgagagg ctgggagggt tgaggggaag ataaactttt 2460 
aaaaagctct tatctttcat ttcaatcagt taaaaatact tgctcagtgt aacaattttg 2520 
cttctcagct tccactctaa tattgttgtg ccattaagca atttagctaa tcctgacatt 2580 
tcttagattc ataatgttag gagcatttaa tctgtatttt acaagttagg aagcagagga 2640 
tcagagatgg gaaaggacta gcccaaggcc aacattaaca agccctctaa caaaaacttt 2700 
acaatacatt tatgttgaat ggaactccaa gatctcacct ctccatccag gaatggagtc 2760 
catg 2764 
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<211> 3228 

<212> ADN 

<213> Homo sapiens 



<400> 24 

gctcgccgcc gccgctgtcg ccgccacctc ctctgatcta cgaaagtcat gttacccaac 60 

accgggaggc tggcaggatg tacagttttt atcacaggtg caagccgtgg cattggcaaa 120 

gctattgcat tgaaagcagc aaaggatgga gcaaatattg ttattgctgc aaagaccgcc 180 

cagccacatc caaaacttct aggcacaatc tatactgctg ctgaagaaat tgaagcagtt 240 

ggaggaaagg ccttgccatg tattgttgat gtgagagatg aacagcagat cagtgctgca 300 

gtggagaaag ccatcaagaa atttggagga attgatattc tggtaaataa tgccagtgcc 360 

attagtttga ccaatacatt ggacacacct accaagagat tggatctgat gatgaacgtg 420 

aacaccagag gcacctacct tgcatctaaa gcatgtattc cttatttgaa aaagagcaaa 480 

gttgctcata tcctcaatat cagtccacca ctgaacctaa atccagtttg gttcaaacag 540 

cactgtgctt ataccattgc taagtatggt atgtctatgt atgtgcttgg aatggcagaa 600 

gaatttaaag gtgaaattgc agtcaatgca ttatggccta aaacagccat acacactgct 660 

gctatggata tgctgggagg acctggtatc gaaagccagt gtagaaaagt tgatatcatt 720 

gcagatgcag catattccat tttccaaaag ccaaaaagtt ttactggcaa ctttgtcatt 780 

gatgaaaata tcttaaaaga agaaggaata gaaaattttg acgtttatgc aattaaacca 840 

ggtcatcctt tgcaaccaga tttcttctta gatgaatacc cagaagcagt tagcaagaaa 900 

gtggaatcaa ctggtgctgt tccagaattc aaagaagaga aactgcagct gcaaccaaaa 960 

ccacgttctg gagctgtgga agaaacattt agaattgtta aggactctct cagtgatgat 1020 

gttgttaaag ccactcaagc aatctatctg tttgaactct ccggtgaaga tggtggcacg 1080 

tggtttcttg atctgaaaag caagggtggg aatgtcggat atggagagcc ttctgatcag 1140 

gcagatgtgg tgatgagtat gactactgat gactttgtaa aaatgttttc agggaaacta 1200 

aaaccaacaa tggcattcat gtcagggaaa ttgaagatta aaggtaacat ggccctagca 1260 

atcaaattgg agaagctaat gaatcagatg aatgccagac tgtgaaggaa aatataaaaa 1320 

aaaagtcgac tgctatgctc aaaaagtaaa aaaagctcaa cagttaaaat ctaatgtttg 1380 

ttttctttcc tgttatatta taaggatatg cacgtttgtt ctggaaaaga tagaatttgt 1440 

ctctaaaaga cttgaaattg taattaaaat ggcaagctaa tcaaacataa gcttcattaa 1500 

gtgggattct aagacagtct gtgtttttat atttcaaggg tttaaccctt tgagccttac 1560 

atctcattca ctgtctttct ccaagaaaag tattttgggc ggacagtcag atcaagcagt 1620 

aaaattagct ctttcaaatc ttcttgtcat gtaaaatgaa gctagtctgt tttaaaattt 1680 

ttagttttgg attgtatact aatgaaaatc ttaatgatgt ttttgatttt tatatactta 1740 

ttttaaagaa aatcttatat agtacatttt acaaaaatta taaaaaatga attagtactg 1800 

gcgaggacta aatgaaacaa taatttttca ttttgataac tagctttcca ggtggactta 1860 

gccataggaa aatattacta atgtaattta acaaattgct gcatgtattc catttaaaaa 1920 

tatgtttaaa ttgtcctaaa acaaaataat tttctcccta ggagtatgca tttggctaca 1980 

gtgttttgaa acagaaacct tagaataggt cattggtatg ggctgaactg tgtatccccc 2040 

aattcatttg ttgaggtcct aactcccatt tcttttgaat gtgactgttc ggagatgagg 2100 

cctttaaaga ggtgacttaa gttcaaagga ggctgttagt ctaatccaac atggtgtcct 2160 

ttggacataa gagataccag caatgtgtgc acagaacaaa gaccaggaga ggacacagtg 2220 

agaaggcagt tatctgcaag caaagagaga ggcttcagaa gaaacaaaat caccagcacc 2280 

ttgatctttg acttctaatc tccagaatag tgagaaataa atttctgttg ttaagccgtc 2340 

cactgtggga ggccgacgca ggaggattgc ttgaggccag gagttcaagg ccagcctgga 2400 

caacatagta agaccctatc tctacccccc taataaatta atttaaaaag ccccccaatc 2460 

tgtggtattt tattatggca gccctagcaa gctaatacag tggtttgaga ggctgggagg 2520 

gttgagggga agataaactt ttaaaaagct cttatctttc atttcaatca gttaaaaata 2580 
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cttgctcagt gtaacaattt tgcttctcag 

caatttagct aatcctgaca tttcttagat 

ttacaagtca ggaagcagag gatcagagat 

caagccctct aacaaaaacc ttacaataca 

ctctccatcc aggaatggag tccatgtaat 

acaagtcagg agattcacag caactgatca 

attatgatga ggaagccccc tctgctttaa 

tgatgttaac caatctgctg tgtctactat 

tacaaatgca gaccattcta tcatacctgg 

tgctacccag ttcatgaatc gctaataaaa 

aaaaaaaaaa aaaaaaaaaa anaanaagan 



cttccactct aatattgttg tgccattaag 2640 
tcataatgtt aggagcattt aatctgtatt 2700 
gggaaaggac tagcccaagg ccaacattaa 2760 
tttatgttga atggaactcc aagatctcac 2820 
caaagtgaac ttaaaaatag gacagtttca 2880 
aagggagtcc agtcaacgtg agcaagcgtg 2940 
tccacacaag gaacgtaacc tgaagtaacc 3000 
gctgtttcct tgttcctgct agtgctgctt 3060 
cggggcttct gttttatttt gtaggctgga 3120 
gccaattaga tctttaaaaa aaaaaaaaaa 3180 
naannaaaan anagaaga 3228 



<210> 25 
<211> 3106 
<212> ADN 

<213> Homo sapiens 
<400> 25 

accgaagtga gcgtggacct gccgaaacat 
gtgtaccact tggaccttgt ggaaacagat 
caggttgcgc actggctgga tcatgccaaa 
gcttatgctt tacactttcg agttaaatac 
gagtttacaa ggtacctgtt tgttttacaa 
aaatgccctt atgaaacagc tgtggaatta 
gagtgcgagc ttccagaaca cacaccagag 
cagacagaag caatggaatt tgatatcttc 
cctgcccagg cggaactctc ctatctgaat 
gacatgcacg ttgtcagggg aagagatggc 
ggcatattaa tctttgaagg agctaacaaa 
aaaatggatt ttaaaaagag caaattgaca 
cgtgagcaag agcacacgtt tgtgttccgg 
tggaagtgtg cagttgagca ccacgcattc 
tccaatagat ccgactttat caggctgggc 
tatcaagcta cacatggctc caggttacga 
aaacgttatc catcccggag acattcaacg 
cagctctgct ctaaaacaaa tccagaagtc 
atccatccca gccagccccg gtggcatcct 
gatgacaggt cgcattggaa agcatcggcc 
cacgaccaga accagaagaa cttaggaggg 
atgactgcac tttgagagac tgaagcatct 
attccatgaa aagtgtcttg gcctcagatg 
gagtagtcct gaaaggtgtt tttggtgtcc 
gcttgtcata atttactgtt gactgcattc 
catattgatg ttctgatttt aaaatcggag 
tcctgatgtt ctttgttatt taattaatgg 
attgctcagc atatattcct gtcgtagaag 
gtggcctgga cgagtcattt ccccttcatt 



gccaaaggcc aggatttgtt tgatcagatt 60 
tactttggcc tccagttcct cgactctgcc 120 
cccataaaaa agcagatgaa aattggacct 180 
tattcttcag aaccaaacaa ccttcgtgag 240 
ctcaggcatg acattctttc tggaaaattg 300 
gctgctctct gtctacaagc ggagcttggg 3 60 
cttgtgtctg agtttcggtt cattccaaat 420 
cagagatgga aagagtgcag gggaaagagc 480 
aaagcgaagt ggctggaaat gtatggggta 540 
tgtgaatatt ctcttggact gaccccgaca 600 
ataggcttat tcttttggcc taaaattacc 660 
ctcgtggtgg tcgaggatga tgatcaggga 720 
ttagacagtg ccaggacctg caaacacctt 780 
ttccgactgc ggacgccagg aaacagcaaa 840 
tctcgcttca gattcagtgg gcggacagaa 900 
agaaccagca cctttgagag gaagcctagt 960 
ttcaaagcaa gcaacccagt gatagcagcc 1020 
cacaattacc agcctcaata tcatcctaat 1080 
cactctccaa atgtcaggcc atcctttcag 1140 
agtggagatg acagccattt tgattatgtc 1200 
atgcaaagta tgatgtatcg agataaactc 1260 
ctcttccatt caccttcata gtttcattgc 1320 
gatggatgtg tttggacgag tgjtctttaag 1380 
atgtaaatat ttgaagataa aaccactata 1440 
tcattaaaat gaaggtaaag gctcaggaat 1500 
tcaaagtcta tgtttatcat tttactatgt 1560 
gagcaaataa aaccagaaga gcttgggaag 1620 
ttgagattgc tagggtccag tttccctagt 1680 
gacctcattt tccccatctg aaaagagagg 1740 
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gttggactaa gtgatctcca aggtcctttc 
ttcattttgt ttaggttgag gacatacatt 
atacccactt ccctgacaga gttactcctt 
agatgttata tagatacagg gggactttga 
tgaatttaag cagtcgtact aatcttaaat 
gctcaagtat gggaataatt tttaatgtct 
tcagaagaca taattgtgaa tacacactgc 
cttcactctt aaaaagcaac gtgcaatcaa 
aggttttctt gaagttgtgc caaagcattc 
agtctgttgg tagaaccaga aatcaatatg 
tatttatttc ccccatttca agccctgagt 
gaaatgtttt attagtattt ctgtgaaatc 
aattgtaatt ttgcccatgt taggccctct 
tattactaaa atctgatctt ttttggctac 
gctgcatacc ttgcacagtg gagctgacta 
caggtgtatt ccattttagc agacgttctg 
atgcgttctg aatcttttca tcttattgat 
aaagattatt cttgcttttt ttttgactcc 
gctatgcaga agtctcattt gtgaatgacc 
ctgaaggtga gcattcagtt aggtgggtgg 
tggcaagagt ggatcttata ggcacagcag 
ggtgaaggtt gtcctgcctg tcacaggtgc 
tcctcagtaa tagtcctgta aaggtacgtg 



<210> 26 
<211> 3313 
<212> ADN 

<213> Homo sapiens 
<400> 26 

gcgggcccct gctcaccggc ggcgcggccg 
ccaccctcta ctgccgcgtc ttcctgctcg 
aacatgccaa aggccaggat ttgtttgatc 
cagattactt tggcctccag ttcctcgact 
ccaaacccat aaaaaagcag atgaaaattg 
aatactattc ttcagaacca aacaaccttc 
tacaactcag gcatgacatt ctttctggaa 
aattagctgc tctctgtcta caagcggagc 
cagagcttgt gtctgagttc cggttcattc 
tcttccagag atggaaagag tgcaggggaa 
tgaataaagc gaagtggctg gaaatgtatg 
atggctgtga atattctctt ggactgaccc 
acaaaatagg cttattcttt tggcctaaaa 
tgacactcgt ggtggtcgag gatgatgatc 
tccggttaga cagtgccagg acctgcaaac 
cattcttccg actgcggacg ccaggaaaca 
t-Sggctctcg cttcagattc agtgggcgga 



caactctaaa attctgcaat ttgttaacat 1800 
caaactaatt ttatcacaag gaaaactgca 1860 
tcagaagcta aataaagtat ataacttatt 1920 
atttcacatc ttaaagcagt tgagctactt 1980 
tgcatagcat ttgttttgat cgaatttgct 2040 
taatgattgg tgctgctaac ttgcgtgatt 2100 
cagaattggg ggattggttt ttaccctaga 2160 
gatcatttat ggctcaaatg aaagcatata 2220 
tgtagagtag gatgagatgg ttgttgccct 2280 
ttgtctttta ggttaaagct tgtaccaaaa 2340 
caaacatttt tttctcttaa taatagacct 2400 
agttgattct tgtgccattt ttgtatatgt 2460 
aaaaaatgtt tgacatcctt tgagatattt 2520 
tgcaaaaatc tattcagcaa gaaggtatca 2580 
cctataaact ctccctaagg catttgttta 2640 
atgctcagtg tatgtgctgc atacaaataa 2700 
agcattttta caaatgtgtt tccaaggaat 2760 
atcttcattt tttttaaatt gattcttgtt 2820 
ttggtaacag aacagttggc ttttggaagt 2880 
agcaagatca tcctagaatg aggctgctct 2940 
ctgatgcctt tcttcatctg gggcaactct 3000 
tgagtagaga gaagtggtgg cagtgggatt 3060 
tttgtcctgg ctactt 3106 



tgcacatctc cgccgccggc gccgccaagg 60 
acgggaccga agtgagcgtg gacctgccga 120 
agattgtgta ccacttggac cttgtggaaa 180 
ctgcccaggt tgcgcactgg ctggatcatg 240 
gacctgctta tgctttacac tttcgagtta 300 
gtgaggagtt tacaaggtac ctgtttgttt 360 
aattgaaatg cccttatgaa acagctgtgg 420 
ttggggagtg cgagcttcca gaacacacac 480 
caaatcagac agaagcaatg gaatttgata 540 
agagccctgc ccaggcggaa ctctcctatc 600 
gggtagacat gcacgttgtc aggggaagag 660 
cgacaggcat attaatcttt gaaggagcta 720 
ttaccaaaat ggattttaaa aagagcaaat 780 
agggacgtga gcaagagcac acgtttgtgt 840 
acctttggaa gtgtgcagtt gagcaccacg 900 
gcaaatccaa tagatccgac tttatcaggc 960 
cagaatatca agctacacat ggctccaggt 1020 
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tacgaagaac cagcaccttt gagaggaagc ctagtaaacg ttatccatcc cggagacatt 1080 
caacgttcaa agcaagcaac ccagtgatag cagcccagct ctgctctaaa acaaatccag 114 0 
aagtccataa ttaccagcct caatatcatc ctaatatcca tcccagccag ccccggtggc 1200 
atcctcactc tccaaatgtc aggccatcct ttcaggatga caggtcgcat tggaaagcat 1260 
cggccagtgg agatgacagc cattttgatt atgtccacga ccagaaccag aagaacttag 1320 
gagggatgca aagta'tgatg tatcgagata aactcatgac tgcactttga gagactgaag 1380 
catctctctt ccattcacct tcatagtttc attgcattcc atgaaaagtg tcttggcctc 1440 
agatggatgg atgtgtttgg acgagtgtct ttaaggagta gtcctgaaag gtgtttttgg 1500 
tgtccatgta aatatttgaa gataaaacca ctatagcttg tcataattta ctgttgactg 1560 
cattctcatt aaaatgaagg taaaggctca ggaatcatat tgatgttctg attttaaaat 1620 
tggagtcaaa gtctatgttt atcattttac tatgttcctg atgttctttg ttatttaatt 1680 
aatgggagca aataaaacca gaagagcttg ggaagattgc tcagcatata ttcctgtcgt 1740 
agaagttgag attgctaggg tccagtttcc ctagtgtggc ctggacgagt catttcccct 1800 
tcattgacct cattttcccc atctgaaaag agagggttgg actaagtgat ctccaaggtc 1860 
ctttccaact ctaaaattct gcaatttgtt aacatttcat tttgtttagg ttgaggacat 1920 
acattcaaac taattttatc acaaggaaaa ctgcaatacc cacttccttg acagagttac 1980 
tcctttcaga agctaaataa agtatataac ttattagatg ttatatagat acagggggac 2040 
tttgaatttc acatcttaaa gcagttgagc tactttgaat ttaagcagtc gtactaatct 2100 
taaattgcat agcatttgtt ttgatcgaat ttgctgctca agtatgggaa taatttttaa 2160 
tgtcttaatg attggtgctg ctaacttgcg tgatttcaga agacataatt gtgaatacac 2220 
actgtcagaa ttgggggatt ggtttttacc ctagacttca ctcttaaaaa gcaacgtgca 2280 
atcaagatca tttatggctc aaatgaaagc atataaggtt ttcttgaagt tgtgccaaag 2340 
cattctgtag agtaggatga gatggttgtt gccctagtct gttggtagaa ccagaaatca 2400 
atatgttgtc ttttaggtta aagcttgtac caaaatattt atttccccca tttcaagccc 2460 
tgagtcaaac atttttttct cttaataata gacctgaaat gctttattag tatttctgtg 2520 
aaatcagttg attcttgtgc catttttgta tatgtaattg taattttgcc catgttaggc 2580 
cctctaaaaa atgtttgaca tcctttgaga tattttatta ctaaaatctg atcttttttg 2640 
gctactgcaa aaatctattc agcaagaagg tatcagctgc ataccttgca cagtggagct 2700 
gactacctat aaactctccc taaggcattt gtttacaggt gtattccatt ttagcagacg 2760 
ttctgatgct cagtgtatgt gctgcataca aataaatgtg ttctgaatct tttcatctta 2820 
ttgatagcat ttttacaaat gtgtttccaa ggaataaaga ttattcttgc tttttntttt 2880 
gactccatct tcattttttt taaattgatt cttgttgcta tgcagaagtc tcatttgtga 2940 
atgaccttgg taacagaaca gttggctttt ggaagtctga aggtgagcat tcagttaggt 3000 
gggtggagca agatcatcct agaatgaggc tgctcttggc aagagtggat cttataggca 3060 
cagcagctga tgcctttctt catctggggc aactctggtg aaggttgtcc tgcctgtcac 3120 
aggtgctgag tagagagaag tggtggcagt gggatttcct cagtaatagt cctgtaaagg 3180 
tacgtgtttg tcctggctac ttgtgctctt cctggcagga aggcatccaa acccttatct 3240 
gtgggctcct ggaaattgtg tatgccatat aataccctct aataaatacc tctctgctta 3300 
aaaaaaaaaa aaa 3313 



<210> 27 

<211> 1539 

<212> ADN 

<213> Homo sapiens 

<400> 27 

ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60 
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atgtctattg cctggagtca tccctgcaga 
aagacgatgc tgtaccagaa gagcagatct 
gcttctctga gccacatctc agagatgccc 
tccagcacta catcaatcca gagcccatgc 
tgctggggcc cttactaacc tggatataca 
ggcctgtaat gctcttcttc tccctgtata 
actatttcct ggaactgcgg cggctgagtc 
agtgttgcac cccagccatg ctcttcccgg 
tgtcccaagt gtactgccac aagggctttg 
gggccaaggg agagagggcc tatgtagtgg 
tctccagtct ccggtacaac tttcatccca 
ctgaagttgg ccacttcttg aagattcaaa 
tgcaggtatt tcactgttta ctgttgttag 
tcaatatgtt aagagccttg gctttggtag 
gtccggacct ctccctccac acagccacac 
ggtgcatttg aacactgatt atattctcca 
cttgtgactg ccaaaaattt tgtgcacagt 
aattttgtga aaggtgagat cctttggaat 
atgtatgttt agaatatatg cccaacgagg 
ccttgacctg atgtaataaa aactgataaa 
ggtgatctgg cttttctgtt acctgggatt 
taattgatat tgttagtgag aactttaagg 
accaaagtca gattgcttat gttgagtagt 
tgactctttg aaaattggac atttcagaat 
gcatatcatt tttcctgact ttcctggctg 



cctacaaccc agactacgtc ctgatggtag 120 
tcccagtctt ggagcacctt ctgcgggctc 180 
tttatctcaa gctgtatcac cccgagaggc 240 
ggatcctgga atgggttggt gtaggcatgt 300 
tgaggtttgc cagccgccca gggtttagct 360 
gcatgggtct ggtggagctg gtgggtcggc 420 
cttccctgta cagtgtggtt cctgcctctc 480 
cacctgcggc ccgccggacc ctcacctacc 540 
gcaaggacat ggcactgtac tcgctgttga 600 
agccgaacct cgtgaaacac atcgggctct 660 
gtctcctcta gggtgccaag agatgccttt 720 
tatttatctc tttatttaga catggttgcc 780 
agatataggc actggggcag ctgaggaacc 840 
cctcctggca ggagcagcag tttgccacag 900 
tgcctcatgc agtctgaccc acccagtgag 960 
tttgttttta agctctgctt tgtgttagag 1020 
gatatgactg ttttaggatc ttaagggtag 1080 
tgagttcttt ctcattgggt atgaaaatgg 1140 
caggaccatg tggatagatt ccatttgttt 1200 
agccgtgcag tgcccggcat cttggaggca 1260 
ttcttttcct atatatctgt agtgcactga 1320 
cacgacaaga tctggaagag cttgtgaacc 1380 
gatttaacat tgaacatttc tgtactactc 1440 
gatacaatat aggggagctc tttacaagta 1500 
actgcttac 1539 



<210> 28 
<211> 3404 
<212> ADN 

<213> Homo sapiens 
<400> 28 

ctcttcctgt gcaacgtgga gcgtagtgtg 
tatgtccctg tggccaatcg ctatgagggc 
accaactcgt ttgagaaaga gaagcaggac 
acctacaacc cagactacgt cctgatggta 
ttcccagtct tggagcacct tctgcgggct 
ctttatctca agctgtatca ccccgagagg 
cggatcctgg aatgggttgg tgtaggcatg 
atgaggtttg ccagccgccc agggtttagc 
agcatgggtc tggtggagct ggtgggtcgg 
ccttccctgt acagtgtggt tcctgcctct 
gcacctgcgg cccgccggac cctcacctac 
ggcaaggaca tggcactgta ctcgctgttg 
gagccgaacc tcgtgaaaca catcgggctc 
agtctcctct agggtgccaa gagatgcctt 
atatttatct ctttatctag acatggttgc 



agccattttg atgccaagtt gctctccaag 60 
actgaggatg attatggtga tgacccttcg 120 
tatgtctatt gcctggagtc atccctgcag 180 
gaagacgatg ctgtaccaga agagcagatc 240 
cgcttctctg agccacatct cagagatgcc 300 
ctccagcact acatcaatcc agagcccatg 360 
ttgctggggc ccttactaac ctggatatac 420 
tggcctgtaa tgctcttctt ctccctgtat 480 
cactatttcc tggaactgcg gcggctgagt 540 
cagtgttgca ccccagccat gctcttcccg 600 
ctgtcccaag tgtactgcca caagggcttt 660 
agggccaagg gagagagggc ctatgtagtg 720 
ttctccagcc tccggtacaa ctttcatccc 780 
tctgaagttg gccacttctt gaagattcaa 840 
ctgcaggtat ttcactgttt actgctgtta 900 
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gagatatagg cactggggca gctgaggaac ctcaatatgt taagagcctt ggctttggta 960 
gcctcctggc aggagcagca gtttgccaca ggtccggacc tctccctcca cacagccaca 1020 
ctgcctcatg cagtctgacc cacccagtga gggtgcattt gaacactgat tatattctcc 1080 
atttgttttt aagctctgct ttgtgttaga gcttgtgact gccaaaaatt ttgtgcacag 1140 
tgatatgact gttttaggat cttaagggta gaattttgtg aaaggtgaga tcctttggaa 1200 
ttgagttctt tctcattggg tatgaaaatg gatgtatgtt tagaatatat gcccaacgag 1260 
gcaggaccat gtggatagat tccatttgtt tccttgacct gatgtaataa aaactgataa 1320 
aagccgtgca gtgcccggca ccttggaggc aggtgatctg gcttttctgt tacctgggat 1380 
tttcttttcc tatatatctg tagtgcactg ataattgata ttgttagtga gaactttaag 1440 
gcacgacaag atccggaaga gcttgtgaac catcaaagtc agattgctta tgttgagtag 1500 
tgatttaaca ttgaacattt ctgtactact ctgactcttt gaaaattgga catttcagaa 1560 
tgatacaata taggggagct ctttacaagt agcatatcat ttttcctgac tttcctggct 1620 
gactgcttac gaaaaaaaaa aaaaaaaagc atggactgaa gtcagaagac ctgacctttt 1680 
atttcagatc tctgccatgg cctaacgacg tgaccacctt gggcaggnca tatantcact 174 0 
ctgggnntca atttcttcga accngtaaaa tgaggacagt aatacttaca tgttaaagtt 1800 
gccttgagga ttaaatngca gaatatatgt aaaacaccta gcaagngctt agtccatagn 1860 
agacacttgg caaacttttc tctcctataa taaacatata caactcaagc ttnnngcgga 1920 
aaaagatatf ggtgatgttg tttaaagtat gagatagggc atggagctgc cacctatgta 1980 
ccagctattc cagatgacca agccctgcta gaataaagac tgacttttca ttgtgacctc 2040 
tgaaggatgt gcagctcagc tttcacctat ccccacgttc acccaagcca aaaagaagaa 2100 
ttgttcattc aaactggaaa tgatctccag cttggaaatg agacttctca tgagcttatt 2160 
ctaagatcag agtctgaaaa ttattttctc aaaagttaca aataaatgtc ttttaacagt 2220 
actgtcagac tagtgaccaa caagttactt tatgaggatg gatgatgata ttagagttca 2280 
agcaattgtc cagtttgttt cgatgccaca gtttgctttt aaattcccat agtgagcttc 2340 
catcttgaga cccactcaac acagaaggat tacataaagg ttgatcaccc acgctctaca 2400 
gatgaacaaa ttgagaccca gagatgctaa actgctctgc aggtcacaaa cctgaacagc 2460 
agcatagcca aaatgggaac ggagctcttc tgacttcaag cccctgcact tttttcttaa 2520 
ccacattaat tttatgaata tctatgtggt caaagtctct tttgtaaaat ctgagtataa 2580 
gctgaactag atcatgtctc tgtaagctaa gatggcagaa acacattgtc atgttagttt 2640 
ggaggagcaa acagatataa gtatgtgttg taatgttata gtgagctgtt atgtatcccc 2700 
cagcaatgtc caaagtgatc agagctacta gatgacttat tacaatgttc agatcccact 2760 
ccttcattcc tcctctctca gtgacctgtc tacccccaag ctttagaact gagctctctc 2820 
caacttagaa ctcattagag tttgttgcat tagtgattgg atctcctcat gaaagttttt 2880 
tgaccaatga cagtagagcc cctttaagct agccaggccc aagataggga agcactgctg 2940 
gtttacattt ctgctctttc taattcagtt gtctattgca tgcagacatc ccctgcccga 3000 
cttctccatt atggaaggct aaggccatcc ttccttgtcc agtttctcta cctacacact 3060 
aacatgcctt ttccccatgg agtgaactct gccagttgtc tttggacatt ttctgcagat 3120 
gcaggctcag ctctgctctt ttgttcccac ccacttctag atcttcctcc atttaatccc 3180 
ttattcttat aaggagtcta atttttgtgt attgtccttg attagggcag ctgacagctt 3240 
tacaccaaag ctgaagtctc tcacttaatc ctaagcaagg ggctagggag aactaagata 3300 
tccttcccat atcaagggat ataggttact agaagggtgg aggtctctta acaggctcac 3360 
tcacctttca gagtttaaat tatggtcagg cttaagaagc tctc 3404 



<210> 29 
<211> 792 
<212> ADN 

<213> Homo sapiens 
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<400> 29 

ttgtacagca agttagctct 
gccactcctt ttctaggtag 
tacctagacc cctttttatt 
atgtctgtgc tttgcaattt 
tgattcaaca agtatttttt 
tgacagaaat gactaataca 
gaaaaacaaa actagcaatt 
cagagagcat ggttgaaggt 
gcttccctaa agaggtcact 
catgaagcta gtattttgct 
catgtatgta ttgttacagg 
ggccagaata tacatgtctt 
cagtacaaat ctgtttccgt 
acacttaatg gg 



tcagggagtt agctctgtct 
agtggacctt gctgttcacg 
cctttgccaa caagtaattg 
catgtgacca tggtgaaatt 
gaatgctgct gtgcatgagg 
ggtatctggc ctcaaggagt 
ctggtaagca gtatgtgttt 
gtatctgtgt gtatgagaag 
cctggggttg agccataaag 
gccagtcatt tctgtagtta 
tgtagtctgc ttggcttccc 
ttttagggtt tgcaccaagg 
tactccatta tccagaaagc 



atcctgcccc tgtctgccta 60 
tcatagatgg ccattccgtg 120 
gaatgtttgg atttaagaac 180 
atgcacacat tctatcattg 240 
catggtgtta gatggcagat 3 00 
ttacagtttc ataggagaaa 360 
tggagagcac ttaacttcat 420 
gtgttggtga taattagaag 480 
atcaagtaga tacaagtggg 540 
ggttgcctat gtggttggag 600 
taagagaatg ccccagtcct 660 
ggaatagaga gtgtctggct 720 
cactgaaatg gcattagcct 780 

792 



<210> 30 
<211> 2733 
<212> ADN 

<213> Homo sapiens 
<400> 30 

ccacttgcca tgaacatgcc acatgccagc aaagagaagg gaagaagatc tgtatttgca 60 

actatggatt tgtagggaac gggaggactc agtgtgttga taaaaatgag tgccagtttg 120 

gagccactct tgtctgtggg aaccacacat cttgccacaa cacccccggg ggcttctatt 180 

gcatttgcct ggaaggatat cgagccacaa acaacaacaa gacattcatt cccaacgatg 240 

gcaccttttg tacagacata gatgagtgtg aagtttctgg cctgtgcagg catggagggc 300 

gatgcgtgaa cactcatggg agctttgaat gctactgtat ggatggatac ttgccaagga 360 

atggacctga acctttccac ccgaccaccg atgccacatc atgcacagaa atagactgtg 420 

gtacccctcc tgaggttcca gatggctata tcataggaaa ttatacgtct agtctgggca 480 

gccaggttcg ctatgcttgc agagaaggat tcttcagtgt tccagaagat acagtttcaa 540 

gctgcacagg cctgggcaca tgggagtccc caaaattaca ttgccaagag atcaactgtg 600 

gcaaccctcc agaaatgcgg cacgccatct tggtaggaaa tcacagctcc aggctgggcg 660 

9tgtggctcg ctatgtctgt caagagggct ttgagagccc tggaggaaag atcacttctg 720 

tttgcacaga gaaaggcacc tggagagaaa gtactttaac atgcacagaa attctgacaa 780 

agattaatga tgtatcactg tttaatgata cctgtgtgag atggcaaata aactcaagaa 840 

gaataaaccc caagatctca tatgtgatat ccataaaagg acaacggttg gaccctatgg 900 

aatcagttcg tgaggagaca gtcaacttga ccacagacag caggacccca gaagtgtgcc 960 

tagccctgta cccaggcacc aactacaccg tgaacatctc cacagcacct cccaggcgct 1020 

cgatgccagc cgtcatcggt ttccagacag ctggtagcag aaactcccac gggagaaata 1080 

cacatataaa agaagttgat ctcttagaag atgatggaag tttcaatatt tcaatattta 1140 

atgaaacttg tttgaaattg aacaggcgtt ctaggaaagt tggatcagaa cacatgtacc 1200 

aatttaccgt tctgggtcag aggtggtatc tggctaactt ttctcatgca acatcgttta 1260 

acttcacaac gagggaacaa gtgcctgtag tgtgtttgga tctgtaccct acgactgatt 1320 

atacggtgaa tgtgaccctg ctgagatctc ctaagcggca ctcagtgcaa ataacaatag 1380 

caactccccc agcagtaaaa cagaccatca gtaacatttc aggatttaat gaaacctgct 144 0 
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tgagatggag aagcatcaag acagctgata 
gccagagatg gtatcagaag gaatttgccc 
gccgagatcc cgaggtgtgc ttggacctac 
gggctctgtc ttcggaactt cctgtggtca 
ccctcccgga agtagaattt tttacggtgc 
ggaaagccaa ggagaaaaat ggaccaatca 
ccctccaaag cacattttct tgtgattctg 
ctgatgctga tggatacgtg gctgcagaac 
tggagatacc tataggagac aggctgtact 
gagggagtga ttactgcatt atattacgaa 
actcctgtgc agtttgggct caggtgaaag 
gtgttggact gggttccctg gctgttgtga 
tgtgatggca gatggacact gagtggggag 
agcttctcag gcgcccgcac agaggctccg 
tgcaactttc tccattccca gctgggcccc 
gaggagtcac cataaggaga aaactcagga 
tctgtgcaat gaacttgaga ctcctgatgt 
agatctgtga atcttggctg ggacttcctc 
acattgactg caagagaatc tctgcaacct 
cagaatccat tctttacaat atgcagtgag 
ttatgaagga ggtcattgaa aaagagaaca 
gaaacagtac ttttcctata attagttgat 



tggaggagat gtatttattc cacatttggg 1500 
aggaaatgac ctttaatatc agtagcagca 1560 
gtccgggtac caactacaat gtcagtctcc 1620 
tctccctgac aacccagata acagagcctc 1680 
acagaggacc tctaccacgc ctcagactga 174 0 
gttcatatca ggtgttagtg cttcccctgg 1800 
aaggcgcttc ctccttcttt agcaacgcct 1860 
tactggccaa agatgttcca gatgatgcca 1920 
3tggggaata ttataatgca cccttgaaaa 1980 
tcacaagtga atggaataag gtgagaagac 204 0 
attcgtcact catgctgctg cagatggcgg 2100 
tcattctcac attcctctcc ttctcagcgg 2160 
gatgcactgc tgctgggcag gtgttctggc 2220 
tgtgacttcc gtccagggag catgtgggcc 2280 
attcctggat ttaagatggt ggctatccct 2340 
attctgagtc ttccctgcta caggaccagt 2400 
acactgtgat attgaccgaa ggctacatac 2460 
tgagtgatgc ctgagggtca gctcctctag 2520 
cctatataaa agcatttctg ttaattcatt 2580 
atgggcttaa gtttgggcta gagtttgact 2640 
gtgacgtagg caaatgtttc aagcacttta 2700 
ata 2733 



<210> 31 
<211> 2694 
<212> ADN 

<213> Homo sapiens 
<400> 31 

ccacttgcca tgaacatgcc acatgccagc 
actatggatt tgtagggaac gggaggactc 
gagccactct tgtctgtggg aaccacacat 
gcatttgcct ggaaggatat cgagccacaa 
gcaccttttg tacagacata gatgagtgtg 
gatgcgtgaa cactcatggg agctttgaat 
atggacctga acctttccac ccgaccaccg 
gtacccctcc tgaggttcca gatggctata 
gccaggttcg ttatgcttgc agagaaggat 
gctgcacagg cctgggcaca tgggagtccc 
gcaaccctcc agaaatgcgg cacgccatcc 
Stgtggctcg ctatgtctgt caagagggct 
tttgcacaga gaaaggcacc tggagagaaa 
agattaatga tgtatcactg tttaatgata 
gaataaaccc caagatctca catgtgatat 
aatcagttcg tgaggagaca gtcaacttga 
tagccctgta cccaggcacc aactacaccg 
cgatgccagc cgtcatcggt ttccagacag 



aaagagaagg gaagaagatc tgtatttgca 60 
agtgtgttga taaaaatgag tgccagtttg 120 
cttgccacaa cacccccggg ggcttctatt 180 
acaacaacaa gacattcatt cccaacgatg 240 
aagtttctgg cctgtgcagg catggagggc 300 
gctactgtat ggatggatac ttgccaagga 360 
atgccacatc atgcacagaa atagactgtg 420 
tcataggaaa ttatacgtct agtctgggca 480 
tcttcagtgt tccagaagat acagtttcaa 540 
caaaattaca ttgccaagag atcaactgtg 600 
tggtaggaaa tcacagctcc aggctgggcg 660 
ttgagagccc tggaggaaag atcacttctg 720 
gtactttaac atgcacagaa attctgacaa 780 
cctgtgtgag atggcaaata aactcaagaa 840 
ccataaaagg acaacggttg gaccctatgg 900 
ccacagacag caggacccca gaagtgtgcc 960 
tgaacatctc cacagcacct cccaggcgct 1020 
ctgaagttga tctcttagaa gatgatggaa 1080 
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gtttcaatat ttcaatattt aacgaaactt 
ttggatcaga acacatgtac caatttaccg 
tttctcatgc aacatcgttt aacttcacaa 
atctgtaccc tacgactgat tatacggtga 
actcagtgca aataacaata gcaactcccc 
caggatttaa tgaaacctgc ttgagatgga 
tgtatttatt ccacatttgg ggccagagat 
cctttaatat cagtagcagc agccgagatc 
ccaactacaa tgtcagtctc cgggctctgt 
caacccagat aacagagcct cccctcccgg 
ctctaccacg cctcagactg aggaaagcca 
aggtgttagt gcttcccctg gccctccaaa 
cctccttctt tagcaacgcc tctgatgctg 
aagatgttcc agatgatgcc atggagatac 
attataatgc acccttgaaa agagggagtg 
aatggaataa ggtgagaaga cactcctgtg 
tcatgctgct gcagatggcg ggtgttggac 
cattcctctc cttctcagcg gtgtgatggc 
ctgctgggca ggtgttctgg cagcttctca 
cgtccaggga gcatgtgggc ctgcaacttt 
tttaagatgg tggctatccc tgaggagtca 
cttccctgct acaggaccag ttctgtgcaa 
tattgaccga aggctacata cagatctgtg 
cctgagggtc agctcctcta gacattgact 
aagcatttct gttaattcat tcagaatcca 
agtttgggct agagtttgac tttatgaagg 
gcaaatgttt caagcacttt agaaacagca 



gtttgaaatt gaacaggcgt tctaggaaag 1140 
ttctgggtca gaggtggtat ctggctaact 1200 
cgagggaaca agtgcctgta gtgtgtttgg 1260 
atgtgaccct gctgagatct cctaagcggc 1320 
cagcagtaaa acagaccatc agtaacattt 1380 
gaagcatcaa gacagctgat atggaggaga 1440 
ggtatcagaa ggaatttgcc caggaaatga 1500 
ccgaggtgtg cttggaccta cgtccgggta 1560 
cttcggaact tcctgtggtc atctccctga 1620 
aagtagaatt ttttacggtg cacagaggac 1680 
aggagaaaaa tggaccaatc agttcatatc 1740 
gcacattttc ttgtgattct gaaggcgctt 1800 
atggatacgt ggctgcagaa ctactggcca 1860 
ctataggaga caggctgtac tatggggaat 1920 
attactgcat tatattacga atcacaagtg 1980 
cagtttgggc tcaggtgaaa gattcgtcac 2040 
tgggttccct ggctgttgtg atcattctca 2100 
agatggacac tgagtgggga ggatgcactg 2160 
ggtgcccgca cagaggctcc gtgtgacttc 2220 
ctccattccc agctgggccc cattcctgga 2280 
ccataaggag aaaactcagg aattctgagt 2340 
tgaacttgag actcctgatg tacactgtga 2400 
aatcttggct gggacttcct ctgagtgatg 2460 
gcaagagaat ctctgcaacc tcctatataa 2520 
ttctttacaa tatgcagtga gatgggctta 2580 
aggtcattga aaaagagaac agtgacgtag 2640 
cttttcctat aattagttga tata 2694 



<210> 32 
<211> 2765 
<212> ADN 

<213> Homo sapiens 
<400> 32 

cacagcagca cattcactat tcagggtgag 
agacgtctgt gccacttgcc atgaacatgc 
ctgtatttgc aactatggat ttgtagggaa 
gtgccagttt ggagccactc ttgtctgtgg 
gggcttctat tgcatttgcc tggaaggata 
tcccaacgat ggcacctttt gtacagacat 
gcatggaggg cgatgcgtga acactcatgg 
cttgccaagg aatggacctg aacctttcca 
aatagactgt ggtacccctc ctgaggttcc 
tagtctgggc agccaggtcc gttatgcttg 
tacagtttca agctgcacag gcctgggcac 
gatcaactgt ggcaaccccc cagaaatgcg 
caggctgggc ggtgtggctc gctatgtctg 



ccacaggagg aaagaagaga aatagagttt 60 
cacatgccag caaagagaag ggaagaagat 120 
cgggaggact cagtgtgttg ataaaaatga 180 
gaaccacaca tcttgccaca acacccccgg 240 
tcgagccaca aacaacaaca agacattcat 3 00 
agatgagtgt gaagtttctg gcctgtgcag 3 60 
gagctttgaa tgctactgta tggatggata 420 
cccgaccacc gatgccacat catgcacaga 480 
agatggctat atcataggaa attatacgtc 540 
cagagaagga ttcttcagtg ttccagaaga 600 
atgggagtcc ccaaaattac attgccaaga 660 
gcacgccatc ttggtaggaa atcacagctc 720 
tcaagagggc tttgagagcc ctggaggaaa 780 
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gatcacttct gtttgcacag agaaaggcac 
aattctgaca aagattaatg atgtatcact 
aaactcaaga agaataaacc ccaagatctc 
ggaccctatg gaatcagtcc gtgaggagac 
agaagtgtgc ctagccctgt acccaggcac 
tcccaggcgc tcgatgccag ccgtcatcgg 
agatgatgga agtttcaata tttcaatatt 
ttctaggaaa gttggatcag aacacatgta 
tctggctaac ttttctcatg caacatcgct 
agtgtgtttg gatctgtacc ctacgactga 
tcctaagcgg cactcagtgc aaataacaat 
cagtaacatt tcaggattta atgaaacctg 
tatggaggag atgtatttat tccacatttg 
ccaggaaatg acctttaata tcagtagcag 
acgtccgggt accaactaca atgtcagtct 
catctccctg acaacccaga taacagagcc 
gcacagagga cctctaccac gcctcagact 
cagttcatat caggtgttag tgcttcccct 
tgaaggcgct tcctccttct ttagcaacgc 
actactggcc aaagatgttc cagatgatgc 
ctatggggaa tattataatg cacccttgaa 
aatcacaagt gaatggaata aggtgagaag 
agattcgtca ctcatgctgc tgcagatggc 
gatcattctc acattcctct ccttctcagc 
aggatgcact gctgctgggc aggtgttctg 
cgtgtgactt ccgtccaggg agcatgtggg 
ccattcctgg atttaagatg gtggctatcc 
gaattctgag tcttccctgc tacaggacca 
gtacactgtg atattgaccg aaggctacat 
tctgagtgat gcctgagggt cagctcctct 
ctcctatata aaagcatttc tgttaattca 
agatgggctt aagtttgggc tagagtttga 
cagtgacgta ggcaaatgtt tcaagcactt 
atata 



ctggagagaa agtactttaa catgcacaga 840 
gcttaatgat acctgtgtga gatggcaaat 900 
atatgtgata tccataaaag gacaacggtt 960 
agtcaacttg accacagaca gcaggacccc 1020 
caactacacc gtgaacatct ccacagcacc 1080 
tttccagaca gctgaagttg atctcttaga 1140 
taatgaaacc tgtttgaaat tgaacaggcg 1200 
ccaatttacc gttctgggtc agaggtggta 1260 
taacttcaca acgagggaac aagtgcctgt 1320 
ttatacggtg aatgtgaccc tgctgagatc 1380 
agcaactccc ccagcagtaa aacagaccat 1440 
cttgagatgg agaagcatca agacagctga 1500 
gggccagaga tggtatcaga aggaatttgc 1560 
cagccgagat cccgaggtgt gcttggacct 1620 
ccgggctctg tcttcggaac ttcctgtggt 1680 
tcccctcccg gaagtagaat tttttacggt 1740 
gaggaaagcc aaggagaaaa atggaccaat 1800 
ggccctccaa agcacatttt cttgtgattc 1860 
ctctgatgct gatggatacg tggctgcaga 1920 
catggagata cctataggag acaggctgta 1980 
aagagggagt gattactgca ttatattacg 2040 
acactcctgt gcagtttggg ctcaggtgaa 2100 
gggtgttgga ctgggttccc tggctgttgt 2160 
ggtgtgatgg cagatggaca ctgagtgggg 2220 
gcagcttctc aggtgcccgc acagaggctc 2280 
cctgcaactt tctccattcc cagctgggcc 2340 
ctgaggagtc accataagga gaaaactcag 2400 
gttctgtgca atgaacttga gactcctgat 2460 
acagatctgt gaatcttggc tgggacttcc 2520 
agacattgac tgcaagagaa tctctgcaac 2580 
ttcagaatcc attctttaca atatgcagtg 2640 
ctttatgaag gaggtcattg aaaaagagaa 2700 
tagaaacagt acttttccta taattagttg 2760 

2765 



<210> 33 

<211> 4745 

<212> ADN 

<213> Homo sapiens 

<400> 33 

gaccagatcc atgactgttg gtggagcatt 
gagtttgact cagatatatg ccttacctga 
gtgggaaacc t-tagaagcgg acttaattga 
cctagtgaat tctcagcagg agaagattga 
tgtgaatgtt gaagagggaa ccaaaaactt 
tctgcctgtg gcaggtgcac tcatcggggg 



tcatactact gaagctgaag ctagttctca 60 
aattcctcaa gatcaaaatg ctgcagaatc 120 
acttagccaa ctggtcactg acttctctct 180 
cagcattgca gaccatgtca acagtgctgc 240 
agggaaggct gcaaaataca agctggcagc 300 
aatggtaggg ggtcctattg gcctccttgc 360 
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aggcttcaaa gtggcaggaa ttgcagctgc 
tggaaaattg atacaaagaa agaaacagaa 
agatcttccc agccaaactg acaagaaatg 
tgccaacatg tctatcctga ggacctttgc 
cacaagtata tcaagatagt ggctactgat 
atatattttg ttgtttgctg gggtgttcat 
gagggtatat aatgtatgtc aggtaaagtt 
tggaaatgtg aaaactgaac ctataactct 
ggttatggaa gactagtttc ttccataacc 
attattgagg tttgttagtg aggaaaagaa 
gcgaaatcag ggcctagtga ggagcacagg 
cctattgcaa tttggtccaa ctatatcttc 
gcaagaggct caacttctct tccaaaaatc 
ctttaaataa ataacacaga atttcaagtg 
ttggtctgtc agcctgtctt ctaacacctc 
ttgtaattat gaaaagttct ttggtttctg 
ttctctcata accttttttg tcttgtctgt 
aggtaaaaag aaaagaaaaa aagaaatttc 
ctaaaatgag caaggagaaa aaaaccacca 
gaggggtgat atatctgcca gatagggggt 
ct 999999 a g ctgagaaccc gcttgctacc 
ctatgcatcc ctttgctttc tatagctggt 
tacctttctc acattctaga caatgatgga 
aatggtgtgg tgctaatctc aacacctgac 
catgtctatc tcaaaccgca gaaaggcttt 
ggcagctccc ctctgtaccc caactcattt 
taacgctttt ttctgagcac agggatgggc 
tctgccagga gctaaggttc attaggggat 
tttactttta gtaactttta ttgatggcta 
tctttcatac gtcttaaatc tcatcaatga 
tcattaaata actagaaagt atcaagtatt 
taataatacc aagaaggaaa tactttgaat 
cctgtgatat tggacacctg tgaggctggg 
agtttctgga ccttgctctg tcactttaac 
aactcaccca ggcacatact aaagcaagat 
acatcacccg tccagcatag tcagctgaaa 
ttctgctgtg tcatttaatt ctgaaactcc 
ttaccccact cttccatccc aaattggcta 
ctagggattc attataaggc aaatctggtt 
gaagctcaca cttggtattg gtatctctca 
tatgtactca tataagccct tgacttctac 
agtcttcaca cataggcaag ttacagtcct 
aacctaatag ccaacttttt catagaaatt 
aaagtgttta taagcatagt cagtgtgaca 
ttttatcata tcagattaaa tattttctcc 
agtgggaaca ctttgattaa tgtctcaaaa 
aatcctaagg actttttttt tttttaacat 
tttcaaaccc tttggctgta acccacagta 



acttggtggt ggggtgttgg gcttcacagg 420 
aatgatggag aagctcactt ccagctgtcc 480 
cagttaaaaa ccaaatttca gtattattgg 540 
tgctgttgga cactccgtca ccttttggaa 600 
gttcaagtgg gattgaagtg tgataaatgg 660 
ggagatgtta agagattgag gccctgggct 720 
tgaagactgc caaggagcag attttctccc 780 
gataaggact tgagatgtgt agaaacgttg 840 
ctgaattgga gaccttaatg ctaagtgtag 900 
taagagttca gaagcctttg ttatcagata 960 
tcgactacat aatggagtcc attggcgaac 1020 
tggtgaagga aattaatgat gtaagaaaat 1080 
ttctggcttc tgaactcttc ctctgcctct 1140 
gtaggagact tattaagcca gtcaccaagc 1200 
aaagatcttg tgccctgtgc tgtccctccc 1260 
999tgaattc cacccatgta taatgaggaa 1320 
catctctgtt catcccttcc tataacctct 1380 
gagatatttt caacattgtt agagtttggg 1440 
agaacatttc ctggggcatg ttccagtttt 1500 
atctgaccca gtcttctttt cagctggtct 1560 
tcacatcctt ttccccagac tttttatctc 1620 
gtttcttccc caaaatggcg ttcccatgct 1680 
caaagacgca tgcaagactc agacccgggg 174 0 
attcacagca agcatggccc agcccaaccg 1800 
aatactggaa aaaaagaatt caagactaca 1860 
aaaataggag gaatcacttt ttgccttact 1920 
acctgcaccc cagaaggtgt gagctgtctc 1980 
tggatggttt atcacttctt tctttctgag 2040 
cctttcatgt ccctgtctaa agagactttc 2100 
aatccagtga aacagcacca tctcttagta 2160 
gctctctgct gctttatatc attaacatat .2220 
aagtgtcaga ttctgatcca gtattggaca 2280 
ataattactt ttgaattaca cctcttctct 2340 
acagggtgat caaacctgaa tgaggatcag 2400 
tcctaaacct cagttccagg ggtaattctg 2460 
ttataaatct aagaaacagt tacatcaaga 2520 
cagtattcta cccttcttca tcactgcata 2580 
tcctttcagc ccaccaactt agcggcagca 2640 
tacataaaga cctgaaggag gcctgtattt 2700 
tttttactga gccagtgtgg aataccactg 2760 
tgctcatcag gattggaata ttactctagc 2820 
tttaaaaagn atctcatttc cctataatgg 2880 
gctagaagag tttgatcaac tataaatgat 2940 
cagaaaccaa tcttaaaatt gaatttaatg 3000 
atgtcttatt tttactgcaa caagttagaa 3060 
tttgtgggcc ctcatttgga taaaggcagc 3120 
aatctgagaa tttctctgta gagcagagac 3180 
aaaaacgcat ttatatcaaa ccttagaata 3240 
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tgtttaatga acaatactta ccattctcat 
ccagttgcaa cccactaaat tgatatctac 
acaccctcac agaggaactg gtatttcttg 
ggcattttac aagtaaggaa actgggcttc 
ctacaaaggg gtgaagccag gaatgttaac 
tctctcagac tatacagcct ctatacaaaa 
gcctgcaatc ccagcactta gggaggcaga 
gagaccagcc tgggcaacat agtgagactc 
gggtgtggca tagcacacac ctgtggtccc 
acttgaactc aggagcagcc ttggtgacag 
aaaaaggtgg gtcatccatt ctcctttacc 
atttgcatct ttttaaaaaa cttctgattc 
ttaatggtag ctgatgcaga cataaacagt 
agaaagtgta tttcaatccc atccacctgc 
aaccattgtt taaacagtgc tttttgtgta 
acaaatttat cataattcat agatcaaatg 
tcatgtactt actgtagtga tgctagtatt 
ctttcagaat tgcctccaaa gacattttgc 
gctgtgtaga actgaccaga gttcctggag 
gtacagggag aattgcatga gtccagaaac 
ctcccttaag tgctctaaga tttttgtaca 
tcacaagaag ttgaggaaac ctgtaatata 
cagagtgcag aaaccaaacc atgctttgtg 
ggtccccttt gtccttcgtt gctgccatat 
ctggggggag gttctcctcg gaaatgaggt 
ctgtg 



gctttttatt gtctcagttt ttaaaatatg 3300 
caatgggttg caacccttag cttgaaaaaa 3360 
aataccttct gtttgccagg cacttcacca 3420 
agagaaaata atttgcagag gtttactcaa 3480 
taggtctgtt gagctacaaa aacttttatg 3540 
ttgagatggg ggttgggggc aggggctcat 3600 
ggccagagga tcacttgagc ccaggagttt 3660 
tgtctgtatg aaaaaaatta agaattagct 3720 
agctacatgg gaagctgaag tgggaggatc 3780 
aacaagaccc tctctcaaaa aaatatttaa 3840 
aaacaggctt tgaaatgaca cattccattc 3900 
cttactgagt gtccagcagc ctcaaagttt 3960 
gctcaatttg gcccttaaac tataaaatca 4020 
ctgcaagatt tcttaatgtt cactagttat 4080 
atttaaaaat aaactttaat gctttttaaa 4140 
attatccttt aaaatgatac ccttgggaaa 4200 
aatattactt agaccaattt tgaagctgct 4260 
agatcatccc agaaaagggg gtatgatggt 4320 
gattttgagg ttatactgaa actgagtgct 4380 
ttccttctgt gggctgcctg ccttcctgcc 4440 
ggagtaagaa tcaaatactg gtaacatcaa 4500 
gctagataat atacaacgtt tgtcttccat 4560 
ttaaccttaa atatgaaagg tgtttctcag 4620 
gaaatcttac aaggaaggat gaggaaaagc 4680 
ggtttttttt gttattaagt agaaccgtgg 4740 

4745 



<210> 34 
<211> 5241 
<212> ADN 

<213> Homo sapiens 
<400> 34 

tgcgccgtgc ccaccgcccg gcctcgagcg 
agaagacagc tgttaccagg gaggtcatac 
aaaaagtgaa attacgccgt cttgaaccag 
caacagacct ggaaaggtta agaaagcacc 
gaatctggga caagttgcat gaagagcata 
gatccaatat ccgagaaatt gagaaacttt 
ttctgaagag aatgatagat cctgttaaag 
tccaactcca tttggaatct gtagaagaac 
tgctacagcc tcctttgacc agatccatga 
ctgaagctag ctctcagagt ttgactcaga 
aaaatgctgc agaatcgtgg gaaaccttag 
tcactgactt ctctctccta gtgaattctc 
atgtcaacag tgctgctgtg aatgttgaag 
aatacaagct ggcagctctg cctgtggcag 



ccccggcggg aggtttttct atatgagtgg 60 

aacattttct taggatgtct gaagatgaag 120 

ctatccagaa attcattaag atagtaatcc .180 

agataaatat tgagaagtat caaaggtgca 240 

tcaatgcagg acgtacagtt cagcaactcc 300 

gtttgaaagt ccgaaaggat gacctagtac 3 60 

aagaagcatc agcagcaaca gcagaatttc 420 

ttaagaagca atttaatgat gaagaaactt 480 

ctgttggtgg agcatttcat actactgaag 540 

tatatgcctt acctgaaatt cctcaagatc 600 

aagcggactt aattgaactt agccaactgg 660 

agcaggagaa gattgacagc attgcagacc 720 

agggaaccaa aaacttaggg aaggctgcaa 780 

gtgcactcat cgggggaatg gtagggggtc 84 0 
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ctattggcct ccttgcaggc ttcaaagtgg 
tgttgggctt cacaggtgga aaattgatac 
tcacttccag ctgtccagat ctccccagcc 
atttcagtat tattggtgcc aacatgtcta 
ccgtcacctt ttggaacaca agtatatcaa 
gaagtgtgat aaatggatat attttgttgt 
attgaggccc tgggctgagg gtatataatg 
gagcagattt tctccctgga aatgtgaaaa 
atgtgtagaa acgttgggtt atggaagact 
ttaatgctaa gtgtagatta ttgaggtttg 
cctttgttat cagatagcga aatcagggcc 
gagtccattg gcgaacccta ttgcaattcg 
aatgatgtaa gaaaatgcaa gaggctcaac 
ctcttcctct gcctctcttt aaataaataa 
aagccagtca ccaagcttgg tctgtcagcc 
ctgtgctgtc cctcccctgt aattatgaaa 
catgtataat gaggaattct ctcataacct 
ccttcctata acctctaggt aaaaagaaaa 
attgttagag tttgggctaa aatgagcaag 
ggcatgttcc agttttgagg ggtgatatat 
tcttttcagc tggcctctgg ggggagctga 
ccagactttt tatctcctat gcatcccttt 
atggcgttcc catgcttacc tttctcacat 
agactcagac ccggggaatg gtgtggtgct 
tggcccagcc caaccgcatg tctatctcaa 
agaattcaag actacaggca gctcccctct 
caccttttgc cttacttaac gcttttttct 
aggtgtgagc tgtctctctg ccaggagcta 
cttctttctt tctgagttta cttttagtaa 
gtctaaagag actttctctt tcatacgtct 
gcaccatttc ttagtatcat taaataacta 
tatatcatta acatattaat aataccaaga 
gatccagtat tggacacctg tgatattgga 
attacacctc ttctctagtt tctggacctt 
cctgaatgag gatcagaact cacccaggca 
tccaggggta attctgacat cacccgtcca 
aacagttaca tcaagattct gctgtgtcat 
tcttcatcac tgcatatcac cccactcttc 
caacttagcg gcagcaccag ggattcatta 
aaggaggccc gtatttgaag ctcacacttg 
gtgtggaata ccactgtatg tactcatata 
ggaatattac tctagcagtc ttcacacata 
catttcccta taatggaacc taatagccaa 
atcaactata aatgataaag tgtttataag 
aaaattgaat ttaatgtttt atcatatcag 
ctgcaacaag ttagaaagtg ggaacacttt 
tttggataaa ggcagcaatc ctaaggactt 
tctgtagagc agagactttc aaaccttttg 



caggaattgc agctgcactt ggtggtgggg 900 
aaagaaagaa acagaaaatg atggagaagc 960 
aaactgacaa gaaatgcagt taaaaaccaa 1020 
tcctgaggac ctttgctgct gttggacact 1080 
gatagtggct actgatgttc aagtgggatt 114 0 
ttgctggggt gttcatggag atgttaagag 1200 
tatgtcaggt aaagtttgaa gactgccaag 1260 
ctgaacctat aactctgata aggacttgag 1320 
agtttcttcc ataaccctga attggagacc 1380 
ttagtgagga aaagaataag agttcagaag 1440 
tagtgaggag cacaggtcga ctacataatg 1500 
gtccaactat atcttctggt gaaggaaatt 1560 
ttctcttcca aaaatcttct ggcttctgaa 1620 
cacagaattt caagtggtag gagacttatt 1680 
tgtcttctaa cacctcaaag atcttgtgcc 1740 
agttctttgg tttctggggt gaattctacc 1800 
tttttgtctt gtctgtcatc tctgttcatc 1860 
gaaaaaaaga aatttcgaga tattttcaac 1920 
gagaaaaaaa ccaccaagaa catttcctgg 1980 
ctgccagata gggggtatct gacccagtct 2040 
gaactcgctt gctacctcac atccttttcc 2100 
gctttctata gctggtgttt cttccccaaa 2160 
tctagacaat gatggacaaa gacgcatgca 2220 
aatctcaaca cctgacattc acagcaagca 2280 
accgcagaaa ggctttaata ctggaaaaaa 2340 
gtaccccaac tcatttaaaa taggaggaat 2400 
gagcacaggg atgggcacct gcaccccaga 2460 
aggttcatta ggggattgga tggtttatca 2520 
cttttattga tggctacctt tcatgtccct 2580 
taaatctcat caatgaaatc cagtgaaaca 2640 
gaaagtatca agtactgctc tctgctgctt 2700 
aggaaatact ttgaataagt gtcagattct 2760 
cacctgtgag gctgggataa ttacttttga 2820 
gctctgtcac tttaacacag ggtgatcaaa 2880 
catactaaag caagattcct aaacctcagt 2940 
gcatagtcag ctgaaattat aaatctaaga 3000 
ttaattctga aactcccagt attctaccct 3060 
catcccaaat tggctatcct ttcagcccac 3120 
taaggtaaat ctggtttaca taaagacctg 3180 
gtattggtat ctctcatttt tactgagcca 3240 
agcccttgac ttttactgct catcaggatt 3300 
ggcaagttac agtcctttta aaaagnatct 3360 
ctttttcata gaaattgcta gaagagtttg 3420 
catagtcagt gtgacacaga aaccaatctt 3480 
attaaatatt ttctccatgt cttattttta 3540 
gattaatgtc ttaaaatttg tgggccctca 3600 
tttttttttt taacataatc tgagaatttc 3660 
gctgtaaccc acagtaaaaa acgcatttat 3720 
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atcaaacctt agaatatgtt taatgaacaa 
cagtttttaa aatatgccag ttgcaaccca 
ccttagcttg aaaaaaacac cctcacagag 
gccaggcact tcaccaggca ttttacaagt 
gcagaggttt actcaactac aaaggggtga 
tacaaaaact tttatgtctc tcagactata 
gggggcaggg gcccatgcct gcaatcccag 
ttgagcccag gagtttgaga ccagcctggg 
aaattaagaa ttagctgggt gtggcatagc 
ctgaagtggg aggatcactt gaactcagga 
tcaaaaaaat atttaaaaaa aggtgggtca 
atgacacatt ccattcattt gcatcttttt 
agcagcctca aagtttttaa tggtagctga 
ttaaactata aaatcaagaa agtgtatttc 
aatgttcact agttataacc attgtttaaa 
tttaatgctt tttaaaacaa atttatcata 
tgataccctt gggaaatcat gtacttactg 
caattttgaa gctgctcttt cagaattgcc 
aagggggtat gatggtgctg tgtagaactg 
actgaaactg agtgctgtac agggagaatt 
tgcctgcctt cctgccctcc cttaagtgct 
atactggtaa catcaatcac aagaagttga 
aacgtttgtc ttccatcaga gtgcagaaac 
gaaaggtgtt tctcagggtc ccctttgtcc 
aaggatgagg aaaagcctgg ggggaggttc 
ttaagtagaa ccgtggctgt g 



tacttaccat tctgatgctt tttattgttc 3780 
ctaaattgat atctaccaat gggttgcaac 3840 
gaactggtat ttcttgaata ccttctgttt 3900 
aaggaaactg ggcttcagag aaaataattt 3960 
agccaggaat gttaactagg tctgttgagc 4020 
cagcctctat acaaaattga gatgggggtt 40&0 
cacttaggga ggcagaggcc agaggatcac 4140 
caacatagtg agactctgtc tgtatgaaaa 4200 
acacacctgt ggtcccagct acatgggaag 4260 
gcagccttgg tgacagaaca agaccctctc 4320 
tccattctcc tttaccaaac aggctttgaa 4380 
aaaaaacttc tgattcctta ctgagtgtcc 4440 
tgcagacata aacagtgctc aatttggccc 4500 
aatcccatcc acctgcctgc aagatttctt 4560 
cagtgctttt tgtgtaattt aaaaataaac 4620 
attcatagat caaatgatta tcctttaaaa 4680 
tagtgatgct agtattaata ttacttagac 4740 
tccaaagaca ttttgcagat catcccagaa 4800 
accagagttc ctggaggatt ttgaggttat 4860 
gcatgagtcc agaaacttcc ttctgtgggc 4920 
ctaagatttt tgtacaggag taagaatcaa 4 980 
ggaaacctgt aatatagcta gataatatac 5040 
caaaccatgc tttgtgttaa ccttaaatat 5100 
ttcgttgctg ccatatgaaa tcttacaagg 5160 
tcctcggaaa tgaggtggtt ttttttgtta 5220 

5241 



<210> 35 

<211> 3014 

<212> ADN 

<213> Homo sapiens 

<400> 35 

cccactctcg ctgttctcct ccactctctc 
gcatgtaccc tccaatcaaa acgaggctga 
cgtttcctga tactttcacc acagggccac 
tacaatgctg tcctggcccg acttccccgc 
cagagaccgt ctccacagtg cagaccattt 
ccagtgcaga gacactccgg caggaactgg 
tgaccgaact gtgaaattct ccccttgtca 
tcttctctct tcgggctttg tgtgctcact 
cgcccaggtc tccatggtta gttgaagcca 
attttatgtc tcctaagcat tagagttttt 
gataagtcta ggaaaagaaa gatgggaaaa 
atctgttaat aaccacaggg gttaatatga 
tttgattttg tatgattgaa acttgcaccg 
taatgaaaga ataattcctt attgctggtt 



tccccatgaa ggaagagacc actggagttt 60 
taaaaacatt cccggttgat acaatgaccc 120 
agtttactgc agacttcaga gacagtaaat 180 
tgatcccagc agcgaccctg aggcctttga 240 
acaccacccg gaaacctgtt tctctggcag 300 
agagagagaa gatgatgaaa agactgttga 3 60 
cctggaagat ggcatggtgc cttctgtccg 420 
ctagcacagc atacaagtgt gtgctttgtt 480 
atttctggct tgacttttgt gggaaaagtt 540 
ctattactct atgtagttga gacaggattt 600 
cgggattccc tttcagaagt acctgtgtgt 660 
tgtaggatct tttactatca atttcaacca 720 
agctttgact gtttgttaaa gagtcatttt 780 
tttcatttac actgataaat acacagatct 840 
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tataaagtct ttaacattca tttgcattca gatgtgagta gaagaactaa aaaaagaaag 900 
ttacatatca ctatgactga aggtacttca gcttaatctg aaatataatt taacttgtga 960 
actccttgga tatgatatta tttggaataa acagaattta tcattgaacc caaagtagga 1020 
aatgatagct tacattgtct aaaaatcctt acaaggttaa gatgattcaa tatcaagaat 1080 
attcagaaaa ttatttctaa agttgatcga ttcatgtcgt attgatagaa tcttgaccag 1140 
aagaaatttt gctcttttta tatagtttca agaaatgtgt ttttaaattt ttattaatgc 1200 
acttgaacaa ctttgcagga ataaagcaac cccctaacca caaaatatcc ctctaaatta 1260 
gttccctagc tttctcaatg aatacacaca tatttttaca tagctatgat cgttgtgtac 1320 
attctccttt gttttacttc tcggcctaac acttgtctcc tcttgtcaac acagattcta 1380 
ctctcaccaa tttaaatgtc tttatatcca tgtaacatgg gtaacctcac ttcaccccat 1440 
tattagatat ttgagttata tctaattttt cactcttata aatagtgctg ctatgaatgt 1500 
ctgtaaaaaa aaaaaaactg ctccttcttt tggattattc ccttaggaat atctccaaag 1560 
agggattaca aggtcaaaga gcatgaagta ttttatagct cttgttttat attgccagat 1620 
tgctttctag aaagatccaa tctttgggtt ggaaggacct taaaggtcat ctagtttagc 1680 
ctccccaccc cctctgaatg cttgaatccc ctcgacaatt tatgatgcca ccagcaatgt 1740 
ataagcattt ctgtttacca atagctctgc cagtattggg ttttgccatt tttatttatt 1800 
tttgctagtt taataggtat gtatagttgt tcttgaagag ttgttttatt tcattaattg 1860 
ctagcaaggc tgagcacttt tccatgtgat gatttactag ttgtatttcc ttgtgtgtaa 1920 
aatgttcatt catttcttat gaccacttgt taagaggaac tgatctcata tatttgtatc 1980 
agaactgtat ttttatgtta tattgtatag tttgctctcc tgcccctctc cttaaaactg 2040 
aatggtgcca ataatttgat actaatgact acaaaaaaag gtaatgcctc atttactagt 2100 
attgttgtaa aatgaggaat gtatgtgaat attcagataa ccgaggatta accctttaag 2160 
tgctgaatct ttaaaatttt aatatatttt ttcttgaggg aaatctttct aaaatgtatt 2220 
acgcacttcc ctgccttagt aaacagagta tactggagag tatttaacct tttcttgatg 2280 
agtcatggtc atgattataa acatcagccc cttttatacc ttggtacggt gcagtgatat 2340 
cattaagagc tatcaatatg tgtagggctt ggcttggcct tttataggat attatgctgt 2400 
tctcactgat ggttttttac tgctctctgc tctgtcagtg gagctatccg gggcaattgt 2460 
agcgtttggg tccttttacc cctatgtccc ccggctatac ttttaaaaca gctttagctg 2520 
ttctttatct tgtgcacatg atacaaaata tgttcccgta caatatgggg ctgtcacttc 2580 
ttgccaaccc agcaccctct tcctcttcta acctgctttc tgaggcttct gctcttcacc 2640 
tcctgctcgc tgatggaaac ctccagggca aagctgaagg tttcttgggg aagccaggaa 2700 
agccagtatt tcctatgtgt cagatctgct tggcttccaa gaagggatgc atgggctttt 2760 
tggccagtgt ttccaggagg ctctgggctt cctgcttctt ccccgcttcc cccagagttc 2820 
acagatgttg aagtttctga aggttgacgt cactggaagt ctgaccacaa acaagttggc 2880 
tgttactgta tttgaaaccc agtacctttg gcagctcacc tctaaccagt aaaataagag 2940 
gattccatgg tttcagcagt tgtcctggtt atttgcctat ttaagtgaat gatgggtgct 3000 
tggcattgtg actg 3014 



<210> 36 

<211> 1575 

<212> ADN 

<213> Homo sapiens 

<400> 36 

tccaggggag atccagaatg catgtgtctc ttcccacgca cttatgtcat gttggtagct 60 

ttagatcagc catggtgaga aaagaacaaa agcttttagt tgtttttgtt ttgttttgga 120 

gaatttgttt accagtaaat acatcactgc ctgtacccca aatgttacca gctccctgag 180 
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gtgtcccaca caccattgcg agttctcaga 
ggacttgtcc cagcatctgt gcctccatac 
catataagat gcttaaggct ctcaaaacag 
tgcttagcca agagatacca ctcaggtaac 
ggagatttac tgctatttta tttggaagaa 
aaaaaaaaaa agtccacaaa tttaatcacc 
ccatatactt ttgtatttaa tagattactt 
ttcaattcct gttcaaccct aaaaactgtg 
gttatgtaat gttcaaagat tcagacacac 
ttatcacact cacttctttt tagctgtgtg 
tctttccacc taattaaaga ggatcyaccc 
gcaacacacc tggagcacaa ttccactttc 
ttccccttct acaagatcaa tatgtaaagg 
acttacttag ttcttagcta cacccactct 
tgtccaagcc cagagagaaa acaatgggaa 
tgcagagggg acaacagact ttctgacctg 
tcattccagc ccaacctatt taactttctg 
catgtcatgc tagccaagag gacattattg 
tgcaatgtgc acattaaaat atggaaattt 
tggattacat gctcacattt aacaaagaga 
gaatttacaa gctaattgtt caataaatct 
aatgaccttg aactgagagc ctgtatctgg 
ttgggttaaa agaatcacat ttattcccaa 
attgccagtt gccaa 



gcatgaactg tcctcagaag agcagggcta 24 0 
caatcctctt tctcacagag aaccacttcc 300 
cagaacaatg aaacatactc tccctacact 360 
ttttttcagg acatggaaga tctgtttcaa 420 
gctggcaact ggtcttgacc aaaatagaaa 480 
tgtagggaac ccatctatca aggtacccta 540 
agaaaccaca aaaataggaa tccttacccc 600 
ataaacgctc ccaaccctgt ggtgatcagg 660 
ctgggtttgg attcagttgc aactgggttg 720 
agcatgaata atttacttag cctctctgtg 780 
cagggttatt ttgaggattc aaaaaggcat 840 
attcaactaa ttcccttccc ttcccccttc 900 
agacatgagg cttactggtt gcttttgaac 960 
aaaattaact ggacattagt gtacagccca 1020 
caatttcaag gtcctcacca ctccttcatt 1080 
agaactggag aatttttaaa acaaaatctc 1140 
tggaggaatt ttacatggag gaagtgagca 1200 
tcattaaaga gaggcattat ttatacaccc 1260 
taaaattatg accaagggct tgaaacatat 1320 
ggaaatgtgt ttcagtttct ggagtggctg 1380 
actcaagata gttacctaag gctttgtggc 1440 
atttagcact tgaaagatct aactggatat 1500 
atcggaatgc tttgtttttc ctgtcagtta 1560 

1575 



<210> 37 
<211> 1607 
<212> ADN 

<213> Homo sapiens 



<400> 37 

gcgaatcacg acgggcggtg gccgttgggt 
gggcgcacgt cagtcaggag gcggaagcgc 
gttgagctcc tcttgcctaa gtggtcgcgc 
gcggtcccgg tgtcctcggg tcccaggtga 
atacttgaaa caaaatagga aaatggcagc 
aaatagagtt gcaatcttgg cagaactgga 
ccagtcttca acaaatcatc ctggagctag 
ggacttccgg gatcacgctg agcagcagca 
gcatgctcat gcacattcat ctggatactt 
tattcttccc gttttacccc gccttgaccc 
tgactttgta atatcaaatg ccaaagctac 
taagaatttt ggtgaacttt gatatttttt 
aaagctgaaa gaagaataac caggatgatg 
ttgattatgt accgtgactg taactttttt 
gaactggatg gtcacgaagt cattccccaa 
tccacagtag attttcaaga atcatttata 



cccggcggga ggcggggttt ccgctccctg 6 0 
agcgggggcg ggaaggttgt agtgccgcga 120 
cccctttaag agcagcgatt gtaaggagag 180 
ttgtgaagtg ctgaccaatt gccactggac 240 
aaactcttca ggacaaggtt ttcaaaacaa 300 
caaagagaaa agaaaactac ttatgcagaa 360 
cattgcactc tcgagaccct ctcttaataa 420 
tattgcagcc caacagaagg cagntttnca 480 
catcactcaa gactctgcat ttgggaacct 540 
agaatgaaga aaacatttgc gatggaaaag 600 
tatcattcag tgctacatga actgtgactt 660 
gtttgtctga aagaaaggaa tgtgtaagtg 720 
agagctgtgg aagctgtatc gtccaaggaa 780 
gtaatgctgt ttaactctca atcagactgt 840 
ctcctagcaa gtttgactga atatatcatg 900 
gtacttaact ttaaagaaac aaggctgctt 960 
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ttaaaaaatg aactaatagg cttaaatcaa 
ctatcagtat accttttgcg tttatagtca 
acttataact acttccccct ttttcacttt 
agtcttaacc atcttttata aacatatgct 
aaataatagg gaatgtggta ggtttttaat 
taaatgatga gtttgtgtgg ttctgttttc 
tgggcacggt gcctcatgcc tgtaatccca 
ctcgagatca ggagtctgag accagcctgg 
agtataaaaa attagccatg tgtggtggca 
tgaggcagga gaatcgcttg aacctgggag 
actgcactcc agcctgggtg acagtgagtc 



ttgcatccat atttgctgtt tataggattg 1020 
acatgtatca tcctgaaata ttctttctgg 1080 
aaaacaaacc tcaagaataa attactaacc 1140 
cttataaatg ttgtgactag atgcaattaa 1200 
ttgtacatcc tcttatttag tgttaccaca 1260 
catttttgtt ctaactgaaa actttttggc 1320 
gcactttggg aggccaaggc gggcagatca 1380 
ccaacatggt gaaaccctgt ctctactaaa 1440 
cacgcctgta ntcccagcta ctcnggaggc 1500 
gcaggggttg cagtgagctg agacggtgtc 1560 
tttgtctcaa agaaaaa 1607 



<210> 38 

<211> 1161 

<212> ADN 

<213> Homo sapiens 

<400> 38 

agctcctctt gcctaagtgg tcgcgccccc 
tcccggtgtc ctcgggtccc aggtgattgt 
ttgaaacaaa ataggaaaat ggcagcaaac 
agagttgcaa tcttggcaga actggacaaa 
tcttcaacaa atcatcctgg agctagcatt 
ttccgggatc acgctgagca gcagcatatt 
gctcatgcac attcatctgg atacttcatc 
cttcctgttt tacctcgcct tgacccagaa 
tttgtaatat caaatgccaa agctactatc 
aattttggtg aactttgata ttttttgttt 
ctgaaagaag aataaccagg atgatgagag 
ttatgtaccg tgactgtaac ttttttgtaa 
tggatggtca cgaagtcatt ccccaactcc 
cagtagattt tcaagaatca tttatagtac 
aaaatgaact aataggctta aatcaattgc 
cagtatacct tttgcgttta tagtcaacat 
ataactactt cccccttttt cactttaaaa 
ttaaccatct tttataaaca tatgctctta 
aatagggaac gtggtaggtt tttaatttgt 
atgatgagtt tgtgtggttc t 



<210> 39 

<211> 1332 

<212> ADN 

<213> Homo sapiens 



tttaagagca gcgattgtaa ggagaggcgg 60 
gaagtgctga ccaattgcca ctggacatac 120 
tcttcaggac aaggttttca .aaacaaaaat 180 
gagaaaagaa aactacttat gcagaaccag 240 
gcactctcga gaccctctct taataaggac 300 
gcagcccaac agaaggcagc tttgcagcat 360 
actcaagact ctgcatttgg gaaccttatt 420 
tgaagaaaac atttgcgatg gaaaagtgac 480 
attcagtgct acatgaactg tgactttaag 540 
gtctgaaaga aaggaatgtg taagtgaaag 600 
ctgtggaagc tgtatcgtcc aaggaattga 660 
tgctgtttaa ctctcaatca gactgtgaac 720 
tagcaagttt gactgaatat atcatgtcca 780 
ttaactttaa agaaacaagg ctgcttttaa 840 
atccatattt gctgtttata ggattgctat 900 
gtatcatcct gaaatattct ttctggactt 960 
caaacctcaa gaataaatta ctaaccagtc 1020 
taaatgttgt gactagatgc aattaaaaat 1080 
acatcctctt atttagtgtt accacataaa 1140 

1161 



<400> 39 

gattaccggt gtganccacc angcccggcc aagaactgat tttaaaataa attccatctc 60 
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agcaataaca atgaaaaata aatgnatana caaatanatt tggtctcaag cattnagaaa 120 
gaggtaattg taatgccctt gggtcganga atgtgnantc tatgtnaata gnttaattgg 180 
cctttttgtt tggaatcttt cgcagcatag ctcatgcaca ttcatctgga tacttcatca 240 
ctcaagactc tgcatttggg aaccttattc ttcctgtttt acctcgcctt gacccagaat 300 
gaagaaaaca tttgcgacgg aaaagtgact ttgtaatatc aaatgccaaa gctactatca 360 
ttcagtgcta catgaactgt gactttaaga attttggtga actttgatat tttttgtttg 420* 
tctgaaagaa aggaatgtgt aagtgaaagc tgaaagaaga ataaccagga tgatgagagc 480 
tgtggaagct gtatcgtcca aggaattgat tatgtaccgt gactgtaact tttttgtaat 540 
gctgcttaac tctcaatcag actgtgaact ggatggtcac gaagtcattc cccaactcct 600 
agcaagtttg actgaatata tcatgtccac agtagatttt caagaatcat ttatagtact 660 
taactttaaa gaaacaaggc tgcttttaaa aaatgaacta ataggcttaa atcaattgca 720 
tccatatttg ctgtttatag gattgctatc agtatacctt ttgcgtttat agtcaacatg 780 
tatcatcctg aaatattcct tctggactta taactacttc cccctttttc actttaaaac 840 
aaacctcaag aataaattac taaccagtct taaccatctt ttataaacat atgctcttat 900 
aaatgttgtg actagatgca attaaaaata atagggaatg tggtaggttt ttaatttgta 960 
catcctctta tttagtgtta ccacataaat gatgagtttg tgtggttctg ttttccattt 1020 
ttgttctaac tgaaaacttt ttggctgggc acggtgcctc atgcctgtaa tcccagcact 1080 
ttgggaggcc aaggcgggca gatcacttga gatcaggagt ttgagaccag cctggccaac 1140 
atggtgaaac cctgtctcta ctaaaagtat aaaaaattag ccatgtgtgg tggcacacgc 1200 
ctgtantccc agctactcng gaggctgagg caggagaatc gcttgaacct gggaggcagg 1260 
ggctgcagtg agctgagacg gtgtcactgc actccagcct gggtgacagt gagtctttgt 1320 
ctcaaagaaa aa 1332 



<210> 40 
<211> 10419 
<212> ADN 

<213> Homo sapiens 
<400> 40 

accgcntccg ggctccttcg gccncgccat 
gcagagctcc aaacgagaat ggaagccgct 
gctgctgctc ttcatcctct tctgcattgg 
aacaggtgca gcagcaagac tagtgtcagg 
gaaaaataca aagttggaag caataccaaa 
tgtattcttt ttggatccat gcaacctgga 
actgtgtgta gcagcgtgtc caaggcaaga 
tgcagagata aatggttcag ccctatgtag 
atctccaaaa tcttctgttc tctgccccaa 
attcttccat cgctgtgctc ctgtgaacat 
gatcaccttt gtcagtgaca atagtgtctt 
caaagaaatt atattgggac tttgcttgtt 
gataatcagg tatatatcaa gagtacttgt 
ttcacttgga ggcacaggtg tactatggtg 
agaaactgtt actcctgagc agcttcagat 
ttatgccatt tcagctacag tgttcacagt 
caaacgtgtt gctcttacca tcgccttgtt 
gccactgcta gtcttccaac ccttctggac 



gggctgctgc agctccgcct cctccgccgc 60 
ggaggaccgt agctgcacag acataccatg 120 
gatgggattt atttgtggct tttcaatagc 180 
atacgacagc tatggaaata tctgtgggca 24 0 
cagtggcatg gaccacaccc agcggaagta 300 
cttgataaac cggaagatta agtctgtagc 360 
actgaaaact ctgagtgatg ttcagaagtt 420 
ctacanccta aagccttctg aatacactac 480 
actaccagtt ccagcgagcg cacctattcc 540 
ttcctgctat gccaagtttg cagaggccct 600 
acacaggctg attagtggag taatgaccag 660 
atcactagtt ctatccatga ttttgatggt 720 
gtggatctta acgattctgg tcatactcgg 780 
gctgtatgca aagcaaagaa ggtctcccaa 840 
agctgaagac aatcttcggg ccctcctcat 900 
gatcttattc ctgataatgt tggttatgcg 960 
ccacgtagct ggcaaggtct tcattcactt 102 0 
tttctttgct cttgtcttgt tttgggtgta 1080 
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ctggatcatg acacttcttt ttcttggcac taccggcagt cctgttcaga atgagcaagg 1140 
ctttgtggag ttcaaaattt ctgggcctct gcagtacatg tggtggtacc atgtggtggg 1200 
cctgatttgg atcagtgaac ttattctagc atgtcagcag atgacagtgg caggagctgt 1260 
ggtaacatac tattttacta gggataaaag gaatttgcca tttacaccta ttttggcatc 1320 
agtaaatcgc cttattcgct accacctagg tacggtggca aaaggatctt tcattatcac 1380 
attagtcaaa attccgcgaa tgatccttat gtatattcac agtcagctca aaggaaagga 1440 
aaatgcttgt gcacgatgtg tgctgaaatc ttgcatttgt tgcctttggt gtcttgaaaa 1500 
gtgcctaaat tatttaaatc agaatgcata cacagccaca gctatcaaca gcaccaactt 1560 
ctgcacctca gcaaaggatg cctttgtcat tctggtggag aatgctttgc gagtggctac 1620 
catcaacaca gtaggagatt ttatgttatt ccttggcaag gtgctgatag tctgcagcac 1680 
aggtttagct gggattatgc tgctcaacta ccagcaggac tacacagtat gggtgctgcc 1740 
tctgatcatc gtctgcctct ttgctttcct agtcgctcat tgcttcctgt ctatttatga 1800 
aatggtagtg gatgtattat tcttgtgttt tgccattgat acaaaataca atgatgggag 1860 
ccctggcaga gaattctata tggataaagt gctgatggag tttgtggaaa acagtaggaa 1920 
agcaatgaaa gaagctggta agggaggccg tcgctgattc cagagagcta aagccgatgg 1980 
cttcgggagc aagttctgct tgaacctagc cgacggttat ggaaacccat tgacattcca 2040 
aaacaatata tacacataac tatgtatttg tgtgtgtggg tgtgtgtata tatgtatatg 2100 
tatgtgtgta tatatgtata tgtatataca cacacacaca taaatcagcc aaaatcagag 2160 
aaaaggaaca gggatttaat acctttttta tgcttatttt tgtcaaacat gtactccttt 2220 
catacgggtg gcttttacaa ggcaacttcc gtcatttaat gttttcaact gtaattgtct 2280 
taatggaaat gttaaaatcc atatctgatt aacattttta ataacttaga ggagatttta 2340 
actttattta aaaataggta aaattattgt acctaattat gtctaaagtt tattcagggg 2400 
taatttccct gatgtctgta taaaatcaag atcttatttt actgatgcat aagtcctagt 2460 
gggtcaagac taggcatatg ctttcagata aataaggaat tactccaatc agttttcccc 2520 
aatcaaagaa gccatgtcat tttactttta gaaacataca attgggccca atatgggaat 2580 
tttcataata gttcatacat ttgtcagcca acattaaaag gtaaccaact cctcaggtat 2640 
ttgtagttta ccctaacgcc tctttaaaag aaagtaggta aaaaaagaaa agggtagata 2700 
atcttccgta tgcaaactct tcccttatat tttgtctttc cttccttttt gactttagta 2760 
gcatcctcca cacatttgtg tgcctgattt gaaaggaagc tggggcaccc agcgagttta 2820 
gcctttaagt ttctgtgtat tgatttgcag attaagtaat gctgggagga ataaagaagg 2880 
gacagaaaca tggaacataa agcattgaaa attccggtgc ttgggcttcg gcttcagagt 2 940 
aacgtcagtg gcttagggtt aaacggccat tttattcaaa tgcttgctat acaatctgaa 3000 
aacacactgg caggtgctcc tctccttggc aattcattga gtatccagag ttctacgatg 3060 
tttaactgaa gaattggcta atgttttgat cctccagtgt gactgttgtt tttgtttggg 3120 
99tgggttgg ggttttttgc tttttattcc tgaagcttac cagatatgaa tggctaatac 3180 
tccattgttc tgcttgttgt aatggtgaat gctttaagaa aaaaaagtgt aatttgctaa 3240 
gaataattca tgatctgttt atgcgataac tcctttttgt tacaattttt ttaaaaaaag 3300 
ctatttttgt taatgtaaag taaatatttc agagcaaatt ttttaaactt attgcactaa 3360 
atacaggctc tgtacaaaaa aaaaaaaaaa aaaaaaaagc ctcagcattt tatcattcca 3420 
tggaaggaga atcttttgaa agaaagcatt gcctcctacc agaactagac agtgaattag 3480 
atcggtatta tggaaatgca tacaagtaat gtcactaggg cttaataagc agccgtttgc 3540 
taatgtgctt cctttcaaag ggttggacct ttaaattgct gcaaaaggta aattgtattt 3600 
ttttttaagt attggtgttc tttactctag ctaggctaaa atttgctaaa tgccttggtt 3660 
tctcttaaaa gttcatgtaa tatttctgat ttttcagaat atttgcaata agagtctgga 3720 
ttttaaaaaa cacatgcata cacacaatta agagctcatg tcttagcaag atctgggaaa 3780 
ccaacattgc gagagtagct attttgaaag aataattctc cagaagttaa catctaatat 3840 
ctagtatcac caaacagtat cgctgttctc ttttattcat ttgaaatgaa tataattata 3 900 
taactaacaa ttgtccaaat agatgagaga gcaaatcatg tgagaaaatt cagaatacca 3 960 
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tctgtttcat agccgcacag attttggact 
tggcaaaagt ctagaagatg ggtatcaaaa 
agaggtgtcc ctccaaagtg acctgatgga 
acttggacat ccctgcatca tggactgttg 
agctatttgg aagctaccag gaatgctttc 
agaaagaaat tttgtatttt tgtataactt 
gttttacaaa taaattttgt tttactaaaa 
tggggggaaa agagttgcaa attaattgcc 
cgtgtagaaa tatgcagata tgcattacac 
gaatatcact ctttcatgag ctttattcct 
tttaagcaat atttaaatgt gttgaggtta 
tcatttcaag tcattcttca gctagctatg 
ccatcttctg cccaagtgag aagaatagat 
atacccgaat aatttcataa atcattgatt 
tgaatcttca aaactgtatt caggactcat 
tgtcaattgt agtagtgacc agagtatcgt 
gtgcataatt tagactttct aagctcctgc 
gagaaaagtt atatttcagt gtaaatccaa 
tgcattagta ataaaacatt agcaatttag 
tggatgagca gagctcaaag ccagttgttc 
ttaggattaa agtttttatt ttatcctata 
aagtagctta actgtatgtc ggtacccaaa 
ttactgagtt tattttaaag ttatgctaga 
tctctctctc tttttttttt tttttttttt 
agttatttcc aataccactg atcttggtat 
agttttagga tttcacccta gtagggggta 
aactgcttta gagcagagtt aatacctctc 
caggcaccac atatgtgtga ggccacatca 
tgcactatta ctagctacta acagccattt 
tctgggatca gttccaaaac cagaactgcc 
ttttggtcag taaccttgtc atttaaattg 
agaagtttcc tccagaaagg tcnttaagct 
cttttctact gctactttaa aaaaaaacac 
ctggaggctt atcagtgcac ctgccacagt 
ctgacacata agagtgcact ataatggctt 
tgtatattga aaaaatgtgg gttcataagt 
gtattcacag cgtaggctgc cttttgcttt 
agaatgcatg ttagcccttt tgaaaagtag 
ttaactcatc tttgttaact tagtggcaca 
gaatatgcca agagaaaatc taaagctagc 
tcgtgtacag ttatgaattt agaatagcac 
gccaaattcc tatactccat gttttaattt 
tctttgaaaa tatctttctt atagaaaact 
gtggaaaacc tttcttttct atagaaatac 
gtacatgtaa agacaaatga tgattcagtt 
aaattatatg gacagaacgc ■ gttctaagga 
gagattgttc gagacctatt aggctattct 
atgattttct ccaggacacg gagctcagaa 



ttcacaaaca ttgggaacta aatttagaat 4020 
cagaagacat tccaggagct agcaatttta 4080 
agtcctgaac ttggaaatta ggttctactc 4140 
ctgctccctg ttccatatgc tcgcaatctc 4200 
taattatcat ttgcaactag aactgtaatc 4260 
gattgtgtgc cattttatat aacaggtcct 4320 
aaaaaaaaaa aaaaaaaaaa aaaaaaaggg 4380 
a 99Ctgtttt ccttaagtaa attcatgtgc 4440 
aggcacacac agagagatat ttaatatgtg 4500 
tgattaattt gataaagcct cacagaggat 4560 
tgtttggata ttcctgctgc ctcttttcat 4620 
ggctgcctta ttgctattcg ctcactgctt 4680 
gaagaacaga aatttctctg tgaaatgtgg 4740 
ctatgtggtg gtttttgtct tcttctgtgg 4800 
atttctagag ttttaattgg ggtcctctat 4860 
ggtttttgcc atcagataat taaggctctg 4920 
ctgaagaata aggtcttcca taatatggaa 4980 
gagacccatc ttctatgaga ggcttaccag 5040 
ctagagcact gagattgtat aatccttgca 5100 
ctttaaagca tttaatgcaa tggctaatgt 5160 
agataattaa gtcctaagtc actacaactt 5220 
ctttttctat aatggttaag gaggaggcac 5280 
aatgtttttc ttttgtagag atgctctctc 5340 
ttccgtgagg gcattaggct gctgattgta 5400 
ctgccaaggg cttccttgcc ttccctgggc 5460 
tgaggcactg acccctttat tctggaccca 5520 
cctccctctt caaaacagct acaggaactg 5580. 
ctgcccctga ggcttcaact atttccacca 5640 
taagagatct cctagcctgc aaggtagaat 5700 
agtaatggtg acttgaatat tttatttgat 5760 
gactttccaa tagccttaac atggcctctg 5820 
ttcgcttttc aataagtaag ttctttactg 5880 
acacacaacc accaataaaa ctctcagagt 5940 
taatttctgt attcttttca tacattccat 6000 
gcctagaact ggtaagaagt ggtctgtgaa 6060 
aaaagcgtaa cgcagatatt tgtgtattct 6120 
aaatgcatat tcatgtatct ttgtgtgcta 6180 
gcactattca tacacagtag cttcttggaa 6240 
tagtccaaat ttttaaaaag caagaccctt 6300 
aaacttaaaa aacaaaataa aaattacacg 6360 
actctttcca ttcagatttc atacatttga 6420 
taaaaggata attttaatcc aagatttaaa 6480 
ttaatgcagt ttttaaactt actgatttct 6540 
tgtagtgccc tttcttccca tcttgatttt 6600 
tcaatattgc atgaacaatt gccactttgt 6660 
aattcgttag taaatttgtg aaaaacatgt 6720 
tcagttttga tgctcagttt tacaacttaa 6780 
taataaagct tttattaatg gtctagtgaa 6840 



WO 00/71710 



44 



PCT/FR00/01426 



gatctagttg aacatggaaa cattgtaatt tacaaatgtc tcagaaattt ctcactttta 6900 

tttgctaaga cctgaattta atatttgata ttcaaaaaca agttattttg aagagacaat 6960 

gggtctcttt gagcttaaga aagctatgga ctatctttcc ttcaaatgca catcacatgt 7020 

ctgtgaacac tcaaaatgct catagaattt cagggccctc agacggccag cttccacccc 7080 

tgtaccccct caggggctaa tgaacccaag tcaaaaggct gctctaaagt tgttctgata 7140 

atgtgttttg aaatgaggaa gtgattaggc ctccactaga gatacttttg agatgatgct 7200 

taccaccttc tgacctggaa tcatttttat aacttaaaga ctttatgtaa tttagtagca 7260 

ggttagggaa tagaaaccac actaatctga aggaataaca agatgatcaa cactgaatct 7320 

tcatgacagt aagattttct ttccttggag gtatgagggt gtgtgtgtgt gtgtgtgtgt 7380 

gtgtgtgtgt ttgtgtgtgt gtgtgtgtgt gtcctggcgg ttatttgggg gcaaggtacc 7440 

agattatttg cagtgagcca aaaaaaaaaa atatccaaga agaaataaat agggaatcct 7500 

tgtaattaat ccatctacca aaacacttga ttctttttat tgtagctcag ctatgacatt 7560 

atgacattat gtggcttagt gttatcagta tactactgtc ttaaaatata tttgtcaaca 7620 

tgtccagttc caacaacagt tgaagatgat gataaattag caaactcaag ggtagtccat 7680 

agttggcaaa aaataaattt ggtagaaagt tggaggagca gatgctgaag gtagaaatgc 7740 

aaaagatgtt ttttcttcct gcataaatca cggaggtgtg ttctgtttta gtgttttcca 7800 

gtcacccact agagcagctt cagattcctc tgccaataga actccacccc cagtccctta 7860 

cctactctat cttctttagg gaagcatgtg gatttcttca catctgcacc ttactattag 7920 

gtaagggtgc tgcatctaca tggaaggctc cctgggccct tgaaaaagca ggcagaaact 7980 

catcaagggg tttgaagttc ttgtgaaatt tgatcccagt ggctcatgac ttatagtcag 8040 

gcatcaaacc atttcctact ttttcaggct gaagaaagtg gaaatataac tggctggtga 8100 

agaaaggaga aaagtcagcc ccctaccccg ccccacactc ctagaaaagt .ttgggggttt 8160 

tttttgtttg tttttggtgt ttttttgaga cggagtctcg ctctatcgcc agcttagagt 8220 

gcagtggctc aatcttagct cactgcaacc tccacctccc aggttcaagt gattctcctg 8280 

catcagcctc ctgagtagct gggaccacag gcatgtgcca ccacacccag ctaatttttg 8340 

tatttttagt agagacgggg tttcaccacg ttggccaggc caatctcgaa ctcctgacct 8400 

caggtgatcc acccgcctca gcctcccaaa gtgctgggat tacaggcatg agccaccgcg 8460 

cccggcctag aagagtttta atgaaccttc cacagtagta aatgcagaga ccactggtgg 8520 

aaattcccat gttggataga aaagggcgta agtccagtct aagtatctaa atgtgatatg 8580 

cccttttgtc acagaagtgt aagacttaaa gggaatattc tgaccttcgt gtatgaatct 8640 

gatccaccca tcctgtcagc taggattata atttgaactg tcgtttcagg agcatgtgtt 8700 

aaatcatatg agtaaaaaaa aagtagacat tgaaaagaag acttgggaat aattgggcag 8760 

atagaatggg ttccatggat cattctagtt gccactagaa aatgtgagct ccttcttcat 8820 

ttaccatgtt gataatccgg tggtgacttt tttttttttt ttgtaaattg tattagatac 8880 

cccacaggaa tgtgacaata ataggatagc tttgggggct ggtgatttga aacagggact 8940 

attaagtaga ttttccccca tcctctaggt tcctgtagtc tgtgctcaga acttggtttt 9000 

tggcccctat tgtttttgcc tattttgatt ttcagagatg atcacatggg gacagttaac 9060 

ttttcttctg ctgtgttgcc ttaatgctac tagattgtgt tgtgttgttg gagttttctg 9120 

acttcttccc tataaaaaga tactgagagc tccataatga aagaagttgt tatactttct 9180 

cagaatattc tggaccactg aatgcacttc taatagagct ttaatctaaa gaagttagtt 9240 

cagtggttat taactgattt tattacagga gaaaaaaact ttaacaaaaa ggcagggaga 9300 

aaagtgtgaa gggcatcaag caaaatgaca ggggcttcaa aaaacaacca aagacaaaac 9360 

cctatcttct gaagaccaaa ggtccaactt tacttactgg ctggcacagc ctttctgaac 9420 

tccttgagtt tagaatagag ctcctagaat aataaggcgg ccaaatttta aagatcagtc 9480 

aatacagtag ggacctgcta ttgatctctc aggcactgag ttcttcacat ccagtgtcaa 9540 

gcccagccca gcatatgggg tgatatgagc agaaaacaca catcggtgtg tcttgatttc 9600 

tcgcagctgt gtaatgtggc atgagaagta tgttttggtg ccacatattt ctcaatctga 9660 

tgcctttttg tctttttttt tttttgccat ttgcatccta tttcatagtg ccaaaatgaa 9720 
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tttttgtatc ttgtcttgtc tttgtccatt 
atgaattcat agtttggaat catttacctt 
gtgtcactac actgtattca tgtgggggaa 
agacacagtt gtagccctag tatttgtgac 
gatggagcat tatgctctca gaggacttta 
ggagttggag ttatcaaatc ttgctgggaa 
aattccatct ggcttcagag aacaatcagc 
cttgtgcaga aatacgaact agaaagaaaa 
tactgactca gttgccagaa ttataatgaa 
attttttatg taataaataa aattttatag 
cacttcccat gcccagggtg gtgacgataa 
ggtcagtatg ctgcaagggt gccccagaat 



ataaactgga ggatcacagt taagccttcc 9780 

accattattt tggatctttt tcttattaca 9840 

caaacatgta ggtgcttgaa catgccccac 9900 

ggtcattatt gacacagtgc agactttnca 9960 

aaaatatgta tattaagcaa ttaactttct 10020 

attaacttcc aagagctctg aattggatgg 10080 

ctatatgaaa cggagctttg aaatgttttt 10140 

gtgctgatct aatgctaagt tttctctgtg 10200 

aactgtattt tagtctaaca aatgtataga 10260 

gaaagaaaaa aaaaaaaaac tgtgttgtaa 10320 

aatcatgggc aacatcttcg tttcaaatta 10380 
tcccagctg 10419 



<210> 41 
<211> 1813 
<212> ADN 

<213> Homo sapiens 
<400> 41 

tgtgtgtagc agcgtgtcca aggcaagaac 
cagagataaa tggttcagcc ctatgtagct 
ctccaaaatc ttctgttctc tgccccaaac 
tcttccatcg ctgtgctcct gtgaacattt 
tcacctttgt cagtgacaat agtgtcttac 
aagaaattat attgggactt tgcttgttat 
taatcaggta tatatcaaga gtacttgtgt 
cacttggagg cacaggtgta ctatggtggc 
aaactgttac tcctgagcag cttcagatag. 
atgccatttc agctacagtg ttcacagtga 
aacgtgttgc tcttaccatc gccttgttcc 
cactgctagt cttccaaccc ttctggactt 
ggatcatgac acttcttttt cttggcacta 
ttgtggagtt caaaatttct gggcctctgc 
tgatttggat cagtgaattc attctagcat 
taacatacta ttttactagg gataaaagga 
taaatcgcct tattcgttac cacctaggta 
tagtcaaaat tccgcgaatg atccttatgt 
atgcttgtgc acgatgtgtg ctgaaatctt 
gcctaaatta tttaaatcag aatgcataca 
gcacctcagc aaaggatgcc tttgtcattc 
tcaacacagt aggagatttt atgttattcc 
gtttagctgg gattatgctg ctcaactacc 
tgatcatcgt ctgcctcttt gctttcctag 
tggtagtgga cgtattattc ttgtgttttg 
ctggcagaga attctatatg gataaagtgc 
caatgaaaga agctggtaag ggaggcgtcg 
agaaaaggtg actggtctca tgagccctga 



tgaaaactct gagtgatgtt cagaagtttg 60 
acaacctaaa gccttctgaa .tacactacat 120 
taccagttcc agcgagtgca cctattccat 180 
cctgctatgc caagtttgca gaggccctga 240 
acaggctgat tagtggagta atgaccagca 3 00 
cactagttct atccatgatt ttgatggtga 360 
ggatcttaac gattctggtc atactcggtt 420 
tgtatgcaaa gcaaagaagg tctcccaaag 480 
ctgaagacaa tcctcgggcc ctcctcattt 540 
tcttattcct gataatgttg gttatgcgca 600 
acgtagctgg caaggtcttc attcacttgc 660 
tctttgctct tgtcttgttt tgggtgtact 720 
ccggcagtcc tgttcagaat gagcaaggct 780 
agtacatgtg gtggtaccat gtggtgggco 84 0 
gtcagcagat gacagtggca ggagctgtgg 900 
atttgccatt tacacctatt ttggcatcag 960 
cggtggcaaa aggatctttc attatcacat 1020 
atattcacag tcagctcaaa ggaaaggaaa 1080 
gcatttgttg cctttggtgt cttgaaaagt 1140 
cagccacagc tatcaacagc accaacttct 1200 
tggtggagaa tgctttgcga gtggctacca 1260 
ttggcaaggt gctgatagtc tgcagcacag 1320 
agcaggacta cacagtatgg gtgctgcctc 1380 
tcgctcattg cttcctgtct atttatgaaa 1440 
ccattgatac aaaatacaat gatgggagcc 1500 
tgatggagtt tgtggaaaac agtaggaaag 1560 
ctgactccag agagctaaag ccgatgctga 1620 
agaatgaact cagaggaggt tgtttacatg 1680 
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aggttctccc actcaccagc tgttgagagt 
ttcaatgaaa gcatgtaaca agtttctcaa 
tgcggctgtc taa 



ctgcgattat gaagagcagg atcttattac 1740 
accaccaaca gccaagtgga tttggtacag 1800 

1813 



<210> 42 

<211> 1377 

<212> ADN 

<213> Homo sapiens 



<400> 42 

ggggcccccc ccncccncca taataggntt 
gntngcccng gggnatattt ttgaggcaan 
tgttactccc tncacccctc ccttaccatt 
acaaagnagt ctcctgccta cacattcatc 
cacctgtaac ccaggatatg aacttctggg 
aacttggaat ggcagtgcac catcctgcat 
tgaaaatggc tttttgcgct ttacagagac 
taaacctgga cacattctag cgggctctga 
gagtggtgcc tccccacgct gtgaagccat 
tggatccatc aaaggaagca actacacata 
cggatatgtg ctgaatggca ctgagaggag 
ggatgagccc atttgcattc ctgtggactg 
ggtgagagga gacgagtaca cattccaaaa 
cttgctcgag ggagccagga gtcgggtttg 
tcccgactgt gtgcctgtca gatgtgccac 
aggcctggac tatggcttca tgaaggaagt 
gcacggtgct ccaaaactca cctgtcagtc 
ctgtaaacca gtcaactgtg gacctcctga 
ttcctttatt catgggggcc atatacagca 
aaattcatca agaaggtgcc tctccaatgg 
gccttgcaga tgttccacac cagtaattga 
ctgtggaaag gcagcccgga ttcagtgctt 
aatcacctgt gaagcngatg gcnngtnnag 



tttgggannc ctggtcccta aacctcnaaa 60 
aaagnccgac attgatggaa ggtcccaata 120 
tgggaagcag tgnctaaacc ctgggaaaat 180 
aaactttctg tatggtacca tggtttcata 240 
gaaccctgtg ctgatctccc aggaagatgg 300 
ttcaattgaa tgtgacttgc ctactgctcc 360 
tagcatggga agtgctgtgc agtatagctg 420 
cttaaggctt tgtctagaga atagaaagtg 480 
ttcatgcaaa aagccaaatc cagtcatgaa 540 
cctgagcacg ttgtactatg agtgtgaccc 600 
aacatgccag gatgacaaaa .actgggatga 660 
cagttcaccc ccagtctcag ccaatggcca 720 
agagattgaa tacacttgca atgaagggtt 780 
tcttgccaat ggaagttgga gtggagccac 840 
cccgccacaa ctggccaatg gggtgacgga 900 
aacattccac tgtcangagg gctacatctt 960 
agatggcaac tgggatgcag agattcctct 1020 
agatcttgcc catggtttcc ctaatggttt 1080 
tcagtgcctt cctggttata agctccatgg 1140 
ctcctggagt ggcagctcac cttcctgcct 1200 
atatggaact gtcaatggga cagattttga 1260 
caaaggcttc aagctcctag gactttctga 1320 
ntntgggttc ccccactgtg aacacac 1377 



<210> 43 

<211> 452 

<212> ADN 

<213> Homo sapiens 



<400> 43 

acaatcttga gcttcaagtc agtggaaaga 
ttatatttca aaacattcaa agtgtcagat 
gaggaaaatc agtggacttg gagtgatcag 
tctgggactt aaatgtgaaa attgaccagc 
attaaggatg tggaagtcaa gcaggaacag 
gaaggcccag cagtggctgc ttgcagggaa 



aatgtacaat ctaattgaac acaaaaaaat 60 
tggttgcata aattaaaaga gattagagaa 120 
caaaggcttc aataagtagg tagaacttaa 180 
ttgggaaggg aaaaagggag gtggtaccac 240 
caggaaatgg gataatgcta acggtatttt 300 
gttggagtcc aatcnttttc cntacgtgcc 360 
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ntttttgggg tatccttccn gatttgctta agtttttntt ttnattaatt gctngggttt 420 
tttttttccc gcngttttgc ccgtntcccc eg 452 



<210> 44 
<211> 562 
<212> ADN 

<213> Homo sapiens 
<400> 44 

gtgeacatet tcagaaaact gatcctaagc 
aatggactaa gagaccttta ggttcattag 
attgtaagat agatagaaaa ctagtggcag 
ctcagatctt tccataagtt agcacttgtt 
acccccatcc gtataaacat cacagataat 
ttcatcaact cctaaagaga tgttagctct 
ggttgctttt tttttttttt ccagggaaaa 
atctgggctc tcccaaaagg cagggatcca 
ggggaactta tggcaaagga aagtcccaac 
tgttnacttg ggggttactt tt 



aaatatcata atgaaaaacc atagattgtt 60 
ctccaaaccc ctcattttac agaagagaga 120 
aatcaagagt aaaactcagg tetgatgett 180 
tcccatgcct cttagttatc tcaaagaatg 240 
geccaggtat ctgggacttt caatcctgtt 300 
tcagttcaat tttttctttt gaatctattt 360 
ggaggactgg gttttaacca ctgcacgacc 420 
tctctcctcg gtagtggcct ggggcatcct 480 
atgggtgctg gggtcttgtt tagtnaaact 540 

562 



<210> 45 
<211> 1766 
<212> ADN 

<213> Homo sapiens 
<400> 45 

anggaaaggg ttaattcccc nnttgggaat 
accnttggtc aanaaaaann ttggggnncc 
cccttgaaag gnnccntnag agaatctcct 
acataacaca tatacttgtt catggggacg 
catgtgcaga agggtatacc tttgagggag 
cctgggagcc accattctcc gatgaatctt 
gtccagaaca tggatttgtg gttggcagta 
agtgtgagcc tggctatgaa ctagagggga 
agtggagtgg aggggtggca atatgeaaag 
tcaatgggaa agctgacatt gaaaacagga 
acagaggcta cagtcttgaa gggccatctg 
gccacccagt ccctctctgc aaaccaaatc 
atgetctget gtctgaaaag gagttttatg 
aaggttttct getgeaggge cacggcatca 
agacaagege caaatgtgaa ■ aaaatctcat 
ttgetcgagg cgtacattat caatatggag 
acatgttgga gggtttcctg aggagtgttt 
etatttgeag agctgtctgt cgatttccat 
atgcttgttc ctgtccagag ggctggatgg 
ttccctgtct gaacggaggt cgctgtgtgg 



tnccnggatt ttcccagant tneaatttec 60 

nctnnnttcn ccngtcanaa agannnnncn 120 

gcagtccnaa aaaatgtcct ctcccggaaa 180 

atttcagtgt gaataggcaa gtttctgtgt 240 

ttaacatatc agcatgtcag cttgatggaa 300 

gcagtccagt ttcttgtggg aaacctgaaa 360 

aatacacctt tgaaagcaca attatttatc 420 

acagggaacg tgtctgccag gagaacagac 480 

agaccaggtg tgaaactcca cttgaatttc 540 

cgactggacc caacgtggta tattcctgea 600 

aggcacactg cacagaaaat ggaacctgga 660 

catgccctgt tccttttgtg attcccgaga 720 

ttgatcagaa tgtgtccatc aaatgtaggg 780 

ttacctgcaa ccccgacgag acgtggacac 840 

gtggcccacc agetcaegta gaaaatgcaa 900 

acatgatcac ctactcatgt cacagtggat 960 

gtttagaaaa tggaacatgg acatcacctc 1020 

gtcagaatgg gggcacctgc caacgcccaa 1080 

ggcgcctctg tgaagaacca atetgeatte 1140 

ccccttacca gtgtgactgc ccgccttggc 1200 
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tggacggggt ctcgctgtca tacagctgtt 
tgtgtaagac caaaccgatg tcactgtctt 
aaaaggagga ctgggtttta accactgcac 
tctctcctcg gtagtgcctg ggcatcctgg 
tgggtcttgt ttagtaaact tgttacttgg 
gttattcctt gtgacatact ttcttacatg 
atataaaaat tatattaaat agatgctgct 
tctattggga aagttcctgg tacacatttt 
aaagtatatt ttgctactaa ataatattnn 
gggatcatag agaggctcat ganttc 



tgccagtctc cctgcttaaa tggtggaaaa 1260 

tcttcttgga cgggacataa ctgttccagg 1320 

gaccatctgg ctctcccaaa agcaggatca 13 BO 

aacttatgca aagaaagtcc aacatggtgc 1440 

ggttactttt tttattttgt gatatatttt 1500 

tttccatttt taaatatgcc tgtattttct 1560 

ctaccctcac aaaatgtaca tattctgctg 1620 

tattcagtta cttaaaatga tttttccatt 1680 

gctggatagn accattttat gaggngccaa 1740 

1766 



<210> 46 

<211> 601 

<212> ADN 

<213> Homo sapiens 

<400> 46 

cagtggaaag aaatgtacaa tctaattgaa 
aagtgtcaga ttggttgcat aaattaaaag 
ggagtgatca gcaaaggctt caataagtag 
aattgaccag cttggaagga aaaagggagg 
gaacagcaga aatggataat gctaacggta 
gtagagtcaa atcttatcct acgtgccttt 
Ctaaataaat gcatgggttt tttattccag 
gaaaatgtgt aagaccaaac cgatgtcact 
ccaggaaaag gaggactggg ttttaaccac 
gatcatctct cctcggtagt gcctgggcat 
9 



cacaaaaaaa tttatagttc aaaacattca 60 

agattagaga agaggaaaat cagtggactt 120 

gtagaactta atctgggact taaatgtgaa 180 

tggtaccaca taaggatgtg aagtcaagca 24 0 

tatgaagacc agcagtggct gctgcaggaa 300 

atggatatca tcagaattgc taagtattaa 360 

ctgtttgcca gtccccctgc ttaaatggtg 420 

gtctttcttc ttggacggga cataactgtt 480 

tgcacgacca tctggctctc ccaaaagcag 54 0 

cctggaactt atgcaaagaa agtccaacat 600 

601 



<210> 47 

<211> 3706 

<212> ADN 

<213> Homo sapiens 

<400> 47 

gaatggcaaa ttctcttaca cggacctaca ctatggacag accgttacct actcttgcaa 60 

ccgaggcttt cggcncgaag gtcccagtgc cttgacctgt ttagagacag gtgattggga 120 

tgtagatgcc ccatcttgca atgccatcca ctgtgattcc ccacaaccca ttgaaaatgg 180 

ttttgtagaa ggtgcagatt acagctatgg tgccataatc atctacagtt gcttccctgg 24 0 

gtttcaggtg gctggtcatg ccatgcagac ctgtgaagag tcaggatggt caagttccat 300 

cccaacacgt atgccaatag actgtggcct ccctcctcat atagattttg gagactgtac 360 

taaactcaaa gatgaccagg gatattttga gcaagaagac gacatgatgg aagttccata 420 

tgtgactcct caccctcctt atcatttggg agcagtggct aaaacctggg aaaatacaaa 480 

ggagtctcct gctacacatt catcaaactt tctgtatggt accatggttt catacacctg 540 

taanccagga tatgaacttc tggggaaccc tgtgctgatc tnccaggaag atggaacttg 600 

gaatggcagt gcaccatcct gcatttcaat tgaatgtgac ttgcctactg ctcctgaaaa 660 
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tggctttttg cgttttacag agactagcat 
tggacacatt ctagcgggct ctgacttaag 
tgcctcccca cgctgtgaag ccatttcatg 
catcaaagga agcaactaca catacctgag 
tgtgctgaat ggcactgaga ggagaacatg 
gcccatttgc attcctgtgg actgcagttc 
aggagacgag tacacattcc aaaaagagac 
tgagggagcc aggagtcggg tttgtcttgc 
ctgtgtgcct gtcagatgtg ccaccccgcc 
ggactatggc ttcatgaagg aagtaacatt 
tgctccaaaa ctcacccgtc agtcagatgg 
accagtcaac tgtggacctc ctgaagatct 
tattcatggg ggccatatac agtatcagtg 
atcaagaagg tgcctctcca atggctcctg 
cagatgttcc acaccagtaa ttgaatatgg 
aaaggcagcc cggattcagt gcttcaaagg 
ctgtgaagcc gatggccagt ggagccctgg 
ttctcttcca atgataccaa atgcgttcat 
gataacttac agctgcaggt ctggatatgt 
agagaaaggg gtatggagcc agccttatcc 
accgtctgtc gccaatgcag tggcaactgg 
actcagatgt ctggaaggtt atacgatgga 
agatggtcgc tggttccctg agagaatctc 
aaacataaca catatacttg tncatgggga 
gtcatgtgca gaagggtata cctttgaggg 
aacctgggag ccaccattct ccgatgaatc 
aagtccagaa catggatttg tggttggcag 
tcagtgtgag cctggctatg aactagaggg 
acagtggagt ggaggggtgg caatatgcaa 
tctcaatggg aaagctgaca ttgaaaacag 
caacagaggc tacagtcttg aagggccatc 
gagccaccca gtccctctct gcaaaccaaa 
gaatgctctg ctgtctgaaa aggagtttta 
ggaaggtttt ctgctgcagg gccacggcat 
acagacaagc gccaaatgtg aaaaaatctc 
aattgctcga ggcgtacatt atcaatatgg 
atacatgttg gagggtttcc tgaggagtgt 
tcctatttgc agagctgtct gtcgatttcc 
aaatgcttgt tcctgtccag agggctggat 
tcttccctgt ctgaacggag gtcgctgtgt 
ctggacgggg tctcgctgtc atacagctgt 
atgtgtaaga ccaaaccgat gtcactgtct 
gaaaaggagg actgggtttt aaccactgca 
atccctcctc ggtagtgcct gggcatcctg 
ctgggtcttg tttagtaaac ttgttacttg 
tgttattcct tgtgacatac tttcttacat 
tatataaaaa ttatattaaa tagatgctgc 
gtctattggg aaagttcctg gcacacattt 



gggaagtgct gtgcagtata gctgtaaacc 720 
gctttgtcta gagaatagaa agtggagtgg 780 
caaaaagcca aatccagtca tgaatggatc 840 
cacgttgtac tatgagtgtg accccggata 900 
ccaggatgac aaaaactggg atgaggatga 960 
acccccagtc tcagccaatg gccaggtgag 1020 
tgaatacact tgcaatgaag ggttcttgct 10B0 
caatggaagt tggagtggag ccactcccga 114 0 
acaactggcc aatggggtga cggaaggcct 1200 
ccactgtcat gagggctaca tcttgcacgg 1260 
caactgggat gcagagattc ctctctgtaa 1320 
tgcccatggt ttccctaatg gtttttcctt 1380 
ctttcctggt tataagctcc atggaaattc 1440 
gagtggcagc tcaccttcct gcctgccttg 1500 
aactgtcaat gggacagatt ttgactgtgg 1560 
cttcaagctc ctaggacttt ctgaaatcac 1620 
gttcccccac tgtgaacaca cttcttgtgg 1680 
cagtgagacc agctcttgga aggaaaatgt 1740 
catacaaggc agttcagatc tgatttgtac 1800 
agtctgcgag cccttgtcct gtgggtcccc 1860 
agaggcacac acctatgaaa gtgaagtgaa 1920 
tacagataca gatacattca cctgtcagaa 1980 
ctgcagtcct aaaaaatgtc ctctcccgga 2040 
cgatttcagc gtgaataggc aagtttctgt 2100 
agttaacata tcagtatgtc agcttgatgg 2160 
ttgcagtcca gtttcttgtg ggaaacctga 2220 
taaatacacc tttgaaagca caattattta 2280 
gaacagggaa cgtgtctgcc aggagaacag 234 0 
agagaccagg tgtgaaactc cacttgaatt 2400 
gacgactgga cccaacgtgg tatattcctg 2460 
tgaggcacac tgcacagaaa atggaacctg 2520 
tccatgccct gttccttttg tgattcccga 2580 
tgttgatcag aatgtgtcca tcaaatgtag 2640 
cattacctgc aaccccgacg agacgtggac 2700 
atgtggtcca ccagctcacg tagaaaatgc 2760 
agacatgatc acctactcat gttacagtgg 2820 
ttgtttagaa aatggaacat ggacatcacc 2880 
atgtcagaat gggggcatct gccaacgccc 2940 
ggggcgcctc tgtgaagaac caatctgcat 3000 
ggcccottac cagtgtgact gcccgcctgg 3060 
ttgccagtcc ccctgcttaa atggtggaaa 3120 
ttcttcttgg acgggacata actgttccag 3180 
cgaccatctg gctctcccaa aagcaggatc 3240 
gaacttatgc aaagaaagtc caacatggtg 3300 
gggttacttt ttttattttg tgatatattt 3360 
gtttccattt ttaaatatgc ctgtattttc 3420 
tctaccctca caaaatgtac atattctgct 3480 
ttattcagtt acttaaaatg atttttccat 3540 
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taaagtatat tttgctacta aataanannn 
aagggattca tagagaggac tcatgatctt 
ccccttacaa taaaggagac ccctttgttc 



tgctggatag taccatttta tgaggtggcc 3600 
tcatctgtgc cactggcacc acataggaga 3660 
tggttccatc ttctat 3706 



<210> 46 
<211> 373 
<212> ADN 

<213> Homo sapiens 
<400> 48 

tgagacattt ccactctggc attctagagt 
ggttccaact tcgtgggctt tatgattgag 
ccctccagat tcatgtcaca ggtgaaagtc 
ggagttgaac caaaataagg aaaacatcaa 
ggatggagga gaaattctgt tcattgcaga 
aatggaactg ggtaggattc aaactcaagt 
ggcatggctt aag 



tctctggctt gcccttgttg ctttaaagct 60 
caacactggt gattgtgatt tctaatacca 120 
tgcctgtggg gagagctttc acattctcct 180 
caaacacagt taccaaaagc ttccaaggag 240 
tggggagaaa ttaaatgaca tcaagtgcat 300 
cccctggttc aagtccttga ctccactctg 360 

373 



<210> 49 
<211> 459 
<212> ADN 

<213> Homo sapiens 
<400> 49 

agtcaaaagg tgaatatata aacatgattt 
agttggcttt tgtcattaaa gaaatcagaa 
cctagatggt atttactact atttctggaa 
tgcataagag acgtgaccac tgaggttgtg 
caaactttct ctgttaaggg tcagatagta 
ctgctataaa caatacataa atgaatgagc 
actgaacttt gaatttcatg tacttttcaa 
tcagaaagcc attaaaaaaa tccaaagacc 



cagatagaat gcagaagctg tatttaatta 60 

agtttggaca actcaggaat ggatttccat 120 

ttaagtttac tgtctatatt caggattttg 180 

tgtcattctt atctctactc caggggtcag 240 

gttttttggc ttttcagtct ctgtttggct 300 

atggctatgt tccaataaaa cttaattgac 360 

atgtcacaaa tgttttcctt ttgatttttt 420 

attcttagc 4 59 



<210> 50 
<211> 2575 ' 
<212> ADN 

<213> Homo sapiens 
<400> 50 

tctggcattc tagagttctc tggcttgccc 
gggctttatg attgagcaac actggtgatt 
gtcacaggtg aaagtctgcc tgtggggaga 
ataaggaaaa catcaacaaa cacagttacc 
ttctgttcat tgcagatggg gagaaattaa 
ggattcaaac tcaagtcccc tggttcaagt 



ttgttgcttt aaagctggtt ccaacttcgt 60 
gtgatttcta ataccaccct ccagattcat 120 
gctttcacat tctcctggag ttgaaccaaa 180 
aaaagcttcc aaggagggat ggaggagaaa 240 
atgacatcaa gtgcataatg gaactgggta 300 
ccttgactcc actctgggca tggctaagtc 360 
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tggcctgtgt ctcatcttcc cagctctagt ggctgtttag tagtgaagat actgatatgc 420 
aggcagccat gttgtaaata agaagcaaat atttttatat ttctctctct tatgtgtata 480 
atatttgagc tacaaacagg ttaaaacaaa agagagactt cagcctagta gcaggcaggg 540 
aaggaagaag tgaatgcagc ttccttccgc ttacatttct aatcaagcta attatttcac 600 
tagtgatttc tcatttgatt accgattttg cttatttatg cttagaactt tcaatgactt 660 
ctcagtgcca ttaaggtaaa atgcaagcca tttctgtgac ctgcaatatc atcttttgcc 720 
actcctcctc acttgctatg tcttagcaag actgagaggc tctcagttct tcagacctgc 780 
tctatctcac ctctcatttt gttcatattc tccacctctt gtgcttgatg aactcctatt 840 
cacctatcag gtcacaactt aaatattttt tcctccaaat ctctggacta cataggtcca 900 
ggcccccatc aaatgctccc atagcacatt gggcttcctc atcaacatgc tcgttatact 960 
tttctagaat tgctggcttg tcctccttgt tatctcccta atgcagagac cattactcat 1020 
cattgtagca gatatttatc catatcaggt actcagcaaa catttgtgga atgaatctat 1080 
atgtgaaact atacttctat ggcaagtttg tttggttcag aaggcttgca tttcatgtat 1140 
attgggagac tggccaacat ttttatattc ttcctcctat gctcaaacca taaataatta 1200 
tgttagcaaa cactgaactt tgtcntttga aacataaata gaaacatcct tagtaacagt 1260 
actaacagta atcatttttc agaaataaga attcacacca gtgatacaga atggcctttg 1320 
accattatct cagagaacta gcagtcgata gacatgctga agtgataatt ccaaaaactt 1380 
cagtttcatt catccctact taaatataag agaatcaact tctattttat gtctgtattc 1440 
ccattttcta atatactact tgtcacagag gagatgccca accagtgttt ttcgtaaagt 1500 
acctgaatag attaataata atgctagtga aatatattta gtgctgttct aagcacttta 1560 
catgaattaa ctcatttaat cctcaccgca accataggaa gtagattcta ttatttatce 1620 
aattttacag atgaaaaaac tgaggctggt cacttgacat aaattaccag tgctggccag 1680 
gactttagag accatttaat ccaatgctct tattttacag gggtgcagct gaagcctaag 1740 
gaggtgatat gatttcctac acattcatgc accttcgtgc acatccatta aaacttttat 1800 
taaatggaac ccactatcca tactccaatt agctaggtgc cttttttccc ccatttagta 1860 
atttacaatc aattggagga ctttttatag ttatatttag aggaaaggag catgttttac 1920 
tctatatcaa ctttcttttc tgcttaaaag cattttgatt ctttatttta ccagtcattt 1980 
tagttctttt aataggttta atacacagat caaacaagac ttaaatacat ttttaacaat 2040 
gtaacaattt aaaagaaatt gcctaaancc taggtcttct aacttggagc ccagtgcttt 2100 
ttttattgct ccgctgagtc aaaaggtgaa tatataaaca tgatttcaga tagaatgcag 2160 
aagctgtatt taattaagtt ggcttttgtc attaaagaaa tcagaaagtt tggacaactc 2220 
aggaatggat ttccatccta gatggtattt actactattt ctggaattaa gtttactgtc 2280 
tatattcagg attttgtgca taagagacgt gaccactgag gttgtgtgtc attcttatct 2340 
ctactccagg ggtcagcaaa ctttctctgt taagggtcag atagtagttt tttggctttt 2400 
cagtctctgt ttggctctgc tataaacaat acataaatga atgagcatgg ctatgttcca 2460 
ataaaactta attgacactg aactttgaat ttcatgtact tttcaaatgt cacaaatgtt 2520 
ttccttttga tttttttcag aaagccatta aaaaaatcca aagaccattc ttagc 2575 



<210> 51 
<211> 231 
<212> ADN 

<213> Homo sapiens 
<400> 51 

tgattatttt cttttcccta tgtttagtta ctgtagtaga aggctatatg aacctctggg 60 
aaaagttaga aggaaaatta acagtgtcag gcctcagtaa catatattaa gtttgtttct 120 
caaggagatc tgtcctcgct ttccttaaac atgttctgga tctgtaaaat aggggattct 180 
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tccatgaagg caaaagggtt gatttagaga gaaaagttta agcgtgggaa t 231 



<210> 52 
<211> 344 
<212> ADN 

<213> Homo sapiens 



<400> 52 

aatcccagaa ggaccttata ggtgagatac 
ctcccccacc aaaaaaaatc tttggaatat 
ggaatgccta ttaagggtat aggataatgg 
attattgata tattggccca ctaaacagga 
tagaaaggtc tctagcagta tggttagttt 
gagtgaattg gagatgttga acctctcttg 



aaagtgttac ctgtgaggaa gtgtattcca 60 

atacaagcag aaatcgggcg aatatgtgtg 120 

tggaaggaac ataaagattg aacaggccaa 180 

attatttttt attgttgctg ctcatggagt 240 

gctgaaacat acatcaaaat ggtccaccat 300 

gtttcatgca gagg 344 



<210> 53 
<211> 402 
<212> ADN 

<213> Homo sapiens 
<400> 53 

ttgttgattc tccccccacc agcccctttg 
agaaggacct tataggtgag atacaaagtg 
caccaaaaaa aatctttgga atatatacaa 
cctattaagg gtataggata atggtggaag 
gatatattgg cccactaaac aggaattatt 
ggtctctagc agtatggtta gtttgctgaa 
attggagatg ttgaacctct cttggtttca 



tttccagacc tataagtaga caagaatccc 60 

ttacctgtga ggaagtgtat tccactcccc 120 

gcagaaatcg ggcgaatatg tgtgggaatg 180 

gaacataaag attgaacagg ccaaattatt 240 

ctttattgtt gctgctcatg gagttagaaa 300 

acatacatca aaatggtcca ccatgagtga 360 

tgcagaggaa gg 4 02 



<210> 54 
<211> 228 
<212> ADN 

<213> Homo sapiens 
<400> 54 

attttcttcc ctagtccatt tctttttgtc 
ctgtgagtcc tgtactcttt ctcattcatt 
aggtgttggg gatatagcag tgaacgaaac 
tctatgggga aggtgaagtg gaaaaaaact 



cagtattcct tttgttcata ggcagttcca 60 

catggctcac tgtgtgtcat gttctattct 120 

agaagacccc tgacactgag gagctcatgt 180 

caaaagaata aataaggg 228 



<210> 55 

<211> 270 

<212> ADN 

<213> Homo sapiens 
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<400> 55 

tgccnttaca atttcancgt tttttacccc 
ttttggaatc attttattct ttcgtatttc 
aatctgttaa actctaaacc aaaaattccc 
gctgcaattc aggtagtggg gtgtcctgaa 
aaattaagtc tttttgtttt gaaaaaaaaa 



caaatggtta atgtaggtgt tttttttttt 60 
tgtgtcagtc gctaggagaa agaccaggaa 120 
attcactgca gagtgatgat tcgcaacact 180 
gtgacaacac atcaccactg cagtcctaat 240 

270 



<210> 56 
<211> 1130 
<212> ADN 

<213> Homo sapiens 
<400> 56 

accaattctc agtccctaga ccccattctt 
gtccatttct ttttgtccag tattcctttt 
actctttctc attcattcat ggctcactgt 
atagcagtga acgaaacaga agacccctga 
tgaagtggaa aaaaactcaa aagaataaat 
taactaggta atgtgattgc gggacctagg 
ggatgggaaa tctcttaggg gagattaaaa 
tttagtcaaa ggaaaagcat tccagagaga 
aaccagtgta gaaagtccaa ggatgaaaga 
Sgatgggagt ggaagatgtg aaggtaagtt 
gatgatatag ctgtttaaag tttattctaa 
aataaattgc ttttccagaa cgttaactgt 
ggctggtctt ataaaggttc tgtgacagta 
gaatgtggga catgcaaaag cagaagacaa 
tctgtccttc atctttctga tattttaaag 
gttccttcat tctttttgat aaattcatca 
cccaaatggt taatgtaggt gttttttttt 
ctgtgtcagt cgctaggaga aagaccagga 
cattcactgc agagtgatga ttcgcaacac 



tgttcctctt cttcctgatt ttcttcccta 60 
gttcataggc agttccactg tgagtcctgt 120 
gtgtcatgtt ctattctagg tgttggggat 180 
cactgaggag ctcatgttct atggggaagg 240 
aagggaattt caagaggttt gaaggaaatc 300 
gatagggaag ggcatagact gctttagata 360 
ttgaactaag acctgaatta catggaaaaa 420 
gagcatggca gtgcaaagcc ttgcagaaag 480 
aagccagtgt agctagagcc tgaagaatga 54 0 
tgcaggggcc agatcatatc aggcctggaa 600 
atgcaatgag aagccagctc ctagcaagat 660 
ccattattta gttcctttgc attctccata 720 
gggaatccat taaagatcta ttacataagg 780 
atgtagaaac cctctgcttc acttggcatt 840 
ctactgtgtt cccacataca tatgctatct 900 
Cttgccttta catttttgtc gttttttacc 960 
tttttggaat cattttattc tttcgtattt 1020 
aaatctgtta aactctaaac caaaaattcc 1080 
tgctgcaatt caggtagtgg 1130 



<210> 57 

<211> 463 

<212> ADN 

<213> Homo sapiens 

<400> 57 

cctaatgagt ggctctgtat tcccatttcc tcatgtggac taatgcggtg tgtggtgttt 60 

ttcttttcct tttcagaagc agtggacagg ggagaatccg ctccaacgtt gtccacctcc 120 

ccttcaccct cctccccttc acccacttcc ccttcaccta ccctgggcag acgaaggcct 180 

gnaaatagga acgtttctta gaaagaagaa aactagtgac atctactttg tgtctctagt 240 

ttgggccatt gtcgtcatgc agatctggct gaacctgtgg attgtgcagt ttgctgccag 300 

tgccgattgc aggtcgttat ctggttnaag tacgatctcg tcttgtcttt ggaagattga 360 
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tttttttttt tttttttttt tnggatttta atntttgagn gacattttac cgtntttgca 420 
aagtaaaaca ttttgatggt ttggnatttt aaatagttna ctt 463 



<210> 58 

<211> 289 

<212> ADN 

<213> Homo sapiens 

<400> 58 

gactacagtg gagagcagct tccaaaaatc agattacgtt ttaatcaata gtgaaaaacc 60 
ttgacatagg aaatgaggag taatcaaatg tagaaggtac tcagaaggca aaatccacag 120 
cagccactaa ggacttaata aatttgggca caaaatatgg gctgccataa ggaagagagc 180 
ccaaataatc aggaaaatat tagggtaaaa gatgtttcta caatgcacct gtcaggggaa 240 
aactctccct tgctctttct agtcttaggg nggaaggaca gttttaggg 289 



<210> 59 

<211> 1542 

<212> ADN 

<213> Homo sapiens 

<400> 59 

tgggccattg tcgtcatgca gatctggttg aacctgtgga ttgtgcagtt gctgccagtg 60 
ccgattgcag gtcgttatct ggttaagtac gatctcgtct tgtctttgaa gattgatttt 120 
tttctttttt tacttttgga ttttaatatt tgagatacat ttaccgtctt gcaaagtaaa 180 
acaatcttat gtttgcattt aaatagtaaa caaacaccat ttggttaatt tattactttg 240 
atacatcttt aatatttcac tttttttttt ttttttgaga cggagtcttg cccaggctgg 300 
aagtgcagtg gcaccatttc agctcactgc aagctccacc tcccaggttc atgccatttt 360 
cctgcctcag cctcccgagt agctgggact ataggtgccc accaccacac ccggctaatt 42 0 
ttttttttat ttttagtaga gacagcgttt caccatgtta gccaggatag tctcgatctc 480 
ctgacctcgt gatctgccca tctcggcctc ccaaagtgct gggattatag gtgtgagcca 540 
ccgcgcccgg ccagtatttc acttttaagc tcaaaaaatg tgtttagctt cttacaattt 600 
catgtagtat ttgagattaa tagctccata gagagatttg attgtttagc catccatgat 660 
tctgtgaagg agaatgttaa caatatctgt gttttggaat ttgaagatcg aatgattttt 720 
tgtttttttt tgagacggag tctcgctctg tcacccaggc tggattgcag tggcgcgatc 780 
tcagctcact gcagcctttg ccccctgggt tcaagcaatt ctcccacctc agcctcctga 840 
gttgctggga ctacaggcat gcgccaccac ccctggctaa ttttttgtat ttttagtaga 900 
gacggagttt caccatgttg gccaggctgg tctcgaatcc ttaccttaag tcatccgctc 960 
acctccgcct cccaaagtgc tggcattaca ggagtgagcc actgcgccta gctgagattg 1020 
aatgattttt gagcgctact cttagggaag cacgttttac cttgcctttt taattcaaag 1080 
gaaatgtagg ctttgagaaa tacatgtatg caaagtcttg tgatttggca gaaaaattaa 1140 
attacatgta tatctatatt atatgtatta catcaaaatg gaatcatagt tttccataat 1200 
ccattaaatc aggtctttgt atcttaatgc tgtggtaatt taaggcccac ctctattgtt 1260 
ttgattctct ctaaaactgt ctttctccta agactagaaa gagcaaggga gagttttctc 1320 
tgacaggtgc attgtagaaa catcttttac ctaatatttt cctgattatt tgggctctct 1380 
tcttatggca gccatatttt gtgccaaatt tattaagtcc ttagtggctg ctgtggattt 1440 
tgccttctga gtaccttcta catttgatta ctcctcattt cctatgtcaa ggtttttcac 1500 
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tattgattaa aacgtaatct gatttttgga agctgctctc ca 1542 



<210> 60 

<211> 1417 

<212> ADN 

<213> Homo sapiens 

<400> 60 

gacacggctg gctgcttttc tcagcgccga agccgcgcca tgctcgtcct cagaagcgcc 60 
ctgactcggg cgctggcctc acggacgctg gcgcctcaga tgtgctcatc ttttgctacg 120 
ggacccagac aatacgatgg aatattctat gaatttcgtt cttattacct taagccctca 180 
aagatgaatg agttcctgga aaattttgag aaaaacgctc atcttcggac agctcactct 240 
gaattggttg gatactggag tgtagaattt ggaggcagaa tgaatacagt gtttcatatt 300 
tggaagtatg ataattttgc tcatcgaact gaagttcgga aagccttggc caaagataag 360 
gaatggcaag aacaattcct cattccaaat ttggctctca ttgataaaca agagagtgag 420 
attacttatc tggtaccatg gtgcaaatta gaaaaacctc caaaagaagg agtctatgaa 480 
ctggccactt ttcagatgaa acctggtggg ccagctctgt ggggtgatgc atttaaaagg '540 
gcagttcatg ctcatgtcaa tctaggctac acaaaactag ttggagtgtt ccacacagag 600 
tacggagcac tcaacagagt tcatgttctt tggtggaatg agagtgcaga tagtcgtgca 660 
gctgggagac ataagtccca tgaggatccc agagttgtgg cagctgttcg ggaaagtgtc 720 
aactacctag tatctcagca gaatatgctt ctgattccta catcgttttc accactgaaa 780 
tagttttcta ctgaaataca aaacatttca ttaactgcta taggatctgt ctgctaatgg 840 
tgcttaaatt ctcccaagag gttctcactt ttatttgaag gaggtggtaa gttaatttgc 900 
tatgtttctt gcattatgaa ggctacatct gtgctttgta agtaccactt caaaaaatag 960 
ttctgtttac tttctgcatg gtatttcagt gtctgtcata cattaaaaat acttgtcact 1020 
gttttaagat cttgactctt catttgtttc agaatagctc ttctactgta ttctgacaac 1080 
tctttgcttt atagcatttt gttgtattca aatgataatg gtagcatttc catgcttgtg 1140 
acagcatttt taagttatta atatatttta tcaacctttc catcatgtct gttttcctgg 1200 
ttttttttgg ttgttttttg accagtaaaa tttattttgt aataccaaat aggatttaag 1260 
aaaattaacg tatttcttta ctatggaaaa ccacattgtc atttgtgaca tcatctatat 1320 
taaatatggt tttcacatta gttatttgtc acttacttgg aaaatgatgc tgttaggtcc 1380 
tggtattaaa aatctagaaa agacttgttg gtttatg 1417 



<210> 61 

<211> 696 

<212> ADN 

<213> Homo sapiens 

<400> 61 

ctctaagcga tctgcagttt atctgggcta ttatgcaatg tgagatatta tttatgagag 60 

gcaggcagtg gcagcttaaa cagacatacc tcctcagcat tcttttccat gcagagttca 120 

aagaggccta agacatctca catttatgtg aaatagttga ggcacaagta tgtggttaac 180 

tacacataaa ttaccaataa aattaaaagt taactaaaat actacagaag acatttaata 240 

ttttgcttca gactgttata gtaccttagg gttatgaaca tcaattacct ttgagcctta 300 

ctatatttaa agggaagggg aagctgacat ttttatcttt tttaatgggt acactctacg 360 

ttaccttaaa ggcttccccg gtttaagcaa aaatagaatt atgtggttta aatcatatac 420 
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cttattcttc atactcagct ccaagtagat 
agatttgcct tccagggggt ctaatttgaa 
ataatagcat tgtatttttc tctattccat 
gcacctgcgc gtccatcttc attcttagcc 
ataacaatca gaagagtctt cataagttcc 



tatgactttt cctaaaactt aacatgacag 480 
gaggaaagta atttaaatgt ataggtttat 540 
tcattctttc attctcttcg atgactccca 600 
aatgaccttt ccttttactt aacagagaaa 660 
cacccc 696 



<210> 62 
<211> 2702 
<212> ADN 

<213> Homo sapiens 
<400> 62 

ctcagaaagg acacggctgg ctgcttttct 
agaagcgccc tgactcgggc gctggcctca 
tttgctacgg gacccagaca atacgatgga 
aagccctcaa agatgaatga gttcctggaa 
gctcactctg aattggttgg atactggagt 
tttcatattt ggaagtatga taattttgct 
aaagataagg aatggcaaga acaattcctc 
gagagtgaga ttacttatct ggtaccatgg 
gtctatgaac tggccacttt tcagatgaaa 
tttaaaaggg cagttcatgc tcatgtcaat 
cacacagaat atggagaact caacagagtt 
agtcgtgcag ctgggagaca taagtcccat 
gaaagtgtca actacctagt ttctcagcag 
ccattgaaat agttttctac tgaaatacaa 
tgctaatggt gcctaaattc tcccaagagg 
ttaattagtt atgtttcttg cattatgaag 
aaaaaatagt tctgtttact ttctgcatgg 
cttgtcactg ttttaagatc ttgactcttc 
tctgacaacc ctttgcttta tagcattttg 
atgcttgtga cagcattttt aagttattaa 
ttttcctggt tttctttggt tgttttttga 
ggatttaaga aaattaacgt atttctttac 
catctatatt aaatatggtt ttcacattag 
gttaggtcct ggtattaaaa atctagaaaa 
tntttataat taattttact aatttctact 
catttatttg ttttaaagaa atatttatgg 
tgcatattca ttgttttttt aaattcacat 
ctatgttgct ataagacagt aatatagtga 
acatcaataa aatagcatgc tgggaacctg 
atgtcctgga gtt ttccttg aaacatcttt 
ctaaaactag atttggtact tccgatagtg 
ttacagacta tcttctgata atctgtattt 
ttacagctat aaaatagtaa attgtgaatt 
tgtacagttt cctctcattt atcaggctct 
gcaatgtgag atattattta tgagaggcag 



cagcgccgaa gccgcgccat gctcgtcctc 60 
cggacgctgg cgcctcagat gtgctcat'ct 120 
atattctatg aatttcgttc ttattacctt 180 
aattttgaga aaaacgctca tcttcggaca 240 
gtagaatttg gaggcagaat gaatacagtg 300 
catcgaactg aagttcggaa agccttggcc 360 
attccaaatt tggctctcat tgataaacaa 420 
tgcaaattag aaaaacctcc aaaagaagga 480 
cctggtgggc cagctctgtg gggtgatgca 540 
ctaggctaca caaaactagt tggngttttc 600 
catgttcttt ggtggaatga gagtgcagat 660 
gaggatccca gagttgtggc ggctgttcgg 720 
aatatgcttc tgattcctgc atcattttca 780 
aacatttcac taactgctct aagatgtgtc 840 
ttctcgcttt tatttgaagg aggtggtaag 900 
gctacatctg tgctttgtaa gtaccacttc 960 
tatttcagtg tctgtcatac attaaaaata 1020 
atttgtttca gaatagctct tctactgtat 1080 
ttgtattcaa atgataatgg tagcatttcc 1140 
tatattttat caacctttcc atcatgtctg 1200 
ccagtaaaat ttattttgta ataccaaata 1260 
tatggaaaac cacattgtca tttgtgacat 1320 
ttatttgtca cttacttgga aaatgatgct 1380 
gacttgttgg tttatgtgct gaaatgtntt 1440 
tagtttggat cactaacaga gatcttggga 1500 
ttatggaaac gcttgcccta ataaaaatcc 1560 
tttatactta tatgatctct aaagctcttg 1620 
taatttacca actttattga aaatgttgtt 1680 
agaaggaagg tttctttagt actgccacag 1740 
catttccatt ttacttgatg cctctaccta 1800 
tatatttaca gctatattat atttacattt 1860 
acagctatgt tattttatat ttttaaaatc 1920 
agctgtccaa gggcaatttg gaaaacaaac 1980 
aagcgatctg cagtttatct gggctattat 2040 
gcagtggcag cctaaacaga catacctcct 2100 
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cagcattctt ttccatgcag agttcaaaga ggcctaagac atctcacatt tatgtgaaat 2160 

agttgaggca caagtatgtg gttaactaca cataaattac caataaaatt aaaagttaac 2220 

taaaatacta cagaagacat ttaatatttt gcttcagact gttatagtac cttagggtta 2280 

tgaacatcaa ttacctttga gccttactat atttaaaggg aaggggaagc tgacattttt 2340 

atctttttta atgggtacac tctacgttac cttaaaggct tccccggttt aagcaaaaat 2400 

agaattatgt ggtttaaatc atatacctta ttcttcatac ttagctccaa gtagattatg 2460 

acttttccta aaacttaaca tgacagagat ttgccttcca gggggtctaa tttgaagagg 2520 

aaagtaattt aaatgtatag gtttatataa tagcattgta tttttctcta ttttattcat 2560 

tctttcattc tcttcgatga ctcccagcac ctgcgcgtcc atcttcattc ttagccaatg 2640 

acctttcctt ttacttaaca gagaaaataa caatcagaag agtcttcata agttcccacc 2700 

cc 2702 



<210> 63 

<211> 335 . 

<212> ADN 

<213> Homo sapiens 

<400> 63 

taccttacca ttgtgcctgt tatgttcaaa aatacatttt gaaaagttct taaaataatt 60 

gctctaaatt gaaatgtcaa aacctgaata ttctacatgt gtcttgggtg atgtccttta 120 

agctaatcct atantacact aaggtacatt taattgtgga aatgtcattt cacaaggcta 180 

tgtaaggcat ccctcgaggc ctgcatttta atgtctagtt ttcaatttta tggcacctaa 240 

aatatcccna tggtggagga tattagggat ggggntatta tcccngggat ntctcacngg 300 

cccggttggg gccccgggga tcttagggtt ttcca .335 



<210> 64 
<211> 447 
<212> ADN 

<213> Homo sapiens 



<400> 64 

tccttactgg attgagcctt ggttacttgc 
tgttgcacct ttgatgtcaa cttatttttg 
agaaaggatc acatctctat cttttcctca 
acttttttcc tttctttttc tctgtggtcg 
ctaccttctc ccttggtctc cgggaatact 
aaatgatttc attacctctc tgggctgggt 
aaacacaacc tttggcctan tttctctnca 
tccttttata attaatctgg gtgnggc 



cacccagagg gtgattgagt tgcagtattc 60 

gcttaaattt tttaaataac ataaggttaa 120 

ttgacctccc tagttctaga caaattctat 180 

attatgtcat tactccctcc ccctcaaaac 240 

gcactctagt gattttcctc ctactacgga 300 

atttccttgg tctttagggc cctttatgga 360 

atttgccctt tttaagaatg gtcctggtac 420 

447 



<210> 65 

<211> 2324 

<212> ADN 

<213> Homo sapiens 
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<400> 65 

actacaagcc agtgaagtgg gtgataagcc tgactccact atctcagcca ggtccttctt 60 
ctaatattat tggccagtct gtggaagaag ctatcagagg ggtgtttgat gcttccctca 120 
aaatggctgg cttctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 180 
ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 240 
actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 300 
ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 360 
ctgacatatc aggaggtggc catccttacc tgacaggctt ggcagtggcc ggtggagcat 420 
actacctagg cctggaagga gcaatcatcg gtcctattct tctctgcata cttgtggttg 480 
cttccaatat ctatagtgcc atgctagtga gtcccacgaa ttcagttccc acgccaaacc 540 
agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 600 
cttcagtagg ttgatgtggt ttcctctgca gtgatttttc taggaagttc aaatttgaca 660 
gcgagttcag ctcagctgtg gccctctgcc cttccagctg tgcctagcaa gcaaaaccca 720 
ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc 780 
tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcac 840 
ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 900 
atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 960 
ctctaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 1020 
tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1080 
tgtagttgag tgagcaggaa aaatgaatct tctacccttc tcccacaatg tattatacgc 114 0 
tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttt 1200 
tatattataa ccctgggaga tacaaagact gaagctcttc ctcctcttcc ttttctcttc 1260 
acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaatac 1320 
ttattaagct gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1380 
ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 144 0 
atccgtttca ttatttggaa ctctgccaat aagttagttt tcagcagaat tttgtattta 1500 
tgtagtattt tcccatctct tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1560 
tgaattgaat tgcaacttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1620 
cattttacaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1680 
agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1740 
accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1800 
gcagattctg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttacg 1860 
agattggtgt tgctatccac ttgttgtgaa tgaagacttg tcctatagta catgacaggg 1920 
ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1980 
ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 2040 
gtggctcaca tctgtaatcc cagcactttg gaaggctgag gtgggtggat tgcctgagcc 2100 
cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2160 
aaaaaaaaaa aaattagctg ngnacggtgg tgtggctata gtctgagcta ctcaggaggc 2220 
tgatgtatga ggatcacctg agtccaggag gtcgaggctg cagtgagcca agatggcgcc 2280 
actgcactcc agcctgggtg agagagtgag acactgtccc aagg 2324 



<210> 66 
<211> 447 
<212> ADN 

<213> Homo sapiens 



<400> 66 
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tgttggacct ggtactctcc accacataat 
attcttttca caacatttga aaagccgtac 
taatgacctt ggttcacaat gaaagtgcta 
gcaagaactg gaagattaac agagagctga 
ttttgggagg aaggggaaga cagggaaaga 
ccccagagct gtgntcctgg gtcttcacct 
aagntgagct tgcccntcag ttcctcantg 
cccaggttga ggttttttcc agatttt 



tatgtcctgg tacttagggt agcctggcta 60 

gtttaacttc atggatgtgg agaaacagca 120 

gccttctttc tcgtggctgg aataagaaat 180 

tacccggact ggtaatccca caactcacta 240 

gaaggaaaaa gggcaaatgg ggaaacattt 300 

gcaaaaaaga tttgcagcca cctaaggaga 36a 

ttcacctacc ttttttcaca acatttgtta 420 

447 



<210> 67 
<211> 564 
<212> ADN 

<213> Homo sapiens 
<400> 67 

attgggcctc gggnccaaaa aacgggcacg 
ntttgggagg gaaggggaag acaggggaaa 
cccagagctg tgcncctggt ctcacctgca 
gctgagctgc ccccctcagt cctcactgtc 
agatgaagac ttctcccaga cttcagaaaa 
taggaaactc agaatcaact tgcctccatc 
ggagtgtgtt gtagcactgt ggaggaatgc 
agtggttctc ttcactaccg taggcatccc 
acattcactt tcttggccag tcttacatgc 
atagtccnat taacttccna aant 



angcggactg ggtaanccca naactcacta 60 
gaganggaaa aaggcaaang ggaaacatnc 120 
aaaaagaatt gcagcccacc ctaagagaaa 180 
accctacctc tatcacaaca attgtaccca 240 
taaagtcaaa ccctagattt tgttttaaaa 300 
ctctgggaaa actgctccca cacaggcctt 360 
agaaaggatg aaagagatct tgattctcct 420 
tcagccattg actcctcctt ctttctcttg 480 
ttatgagtct actttccaat aaatttactc 540 

564 



<210> 68 
<211> 604 
<212> ADN 

<213> Homo sapiens 
<400> 68 

cacataatta tgtcctggta cttagggtag 
agccgtaggc attaacttca tggatgtgga 
aaagtgctag ccttctttct cgtggctgga 
aagagctgat acccggactg gtaatcccac 
agggaaagag aaggaaaaag gcaaatggga 
acctgcaaaa aagaattgca gccacctaag 
gtcacctacc tctatcacaa caattgtacc 
taaagtcaaa ccctagattt tgttttaaaa 
ctctgggaaa actgctccca cacaggcctt 
agaaaggatg aaagagatct tgattctcct 
tcag 



cctggctaat tcntttcaca acatttgaaa 60 
gaaacagcat aatgaccttg gttcacaatg 120 
ataagaaatg caagaactgg aagattaaca 180 
aactcactat tttgggagga aggggaagac 240 
aacattcccc agagctgtgc tcctggtctc 300 
agaaagctga gctgcccctc agtcctcact 360 
aagatgaagc cttccccaga cttcagaaaa 420 
taggaaactc agaatcaact tgcctccatc 480 
ggagtgtgtt gtagcactgt ggaggaatgc 540 
agtggttctc ttcactaccg taggcatccc 600 

604 



<210> 69 
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<211> 482 
<212> ADN 

<213> Homo sapiens 
<400> 69 

aaaaagctct gccagctgag cgnacttaaa 
attttgggca gtaacaacat accctgcccg 
cccacgaaca aaaagtatca actcaggatt 
aggggctact agtttggata ctacacctac 
aggtaatgga gtagcagggt taagtaggtt 
aggtcagaag ggaggncagg gaggaaaatt 
tttggctgga aaantgctgg agcttgggtt 
gtgggaattt tggcaantta agtttcnttc 



ttgaggaaga gttcccttct ctattaactc 60 
atattttcct tctgagactt tggcatagga 120 
atccaatgga gcatctcata aatcaacaca 180 
acaattgtga tctttaccac agtcagtcag 240 
ttaggatggg agtaggcatt ttaggatggg 300 
tncattaagg ttcataaggt gttagttttc 360 
gggattttag gtaggacttt tccacagcct 420 
ccttaaaacc cgttccggtg gaaanttgtt 480 

482 



<210> 70 

<211> 402 

<212> ADN 

<213> Homo sapiens 

<400> 70 

ttccagntat ggatatgtta cagacatgac tgaattggtg gccttagctg aacattttga 60 

gaggactctg gagcaagaaa aaacccaaaa gactaccaag cttatgtctc accaattaca 120 

acagttacag gggctgagac caaaggaacc ttctttttta ttttaaatca caaccaagag 180 

atagatccta ggaacaagaa attcttttcc ccgaggatgt ctgccttcct tggcaaataa 240 

ggcagggaca ctgggaaaag agttgtctgc ttctctgtta ggtctaccaa taaggcctcc 300 

tcccattagg gccacactgt ttcaccacta aagggaaggc ctaaggacag atcctgtgtc 360 

tttaaaaaaa aaaaaaattg gaggcggcgg caggccacca ng 402 



<210> 71 
<211> 758 
<212> ADN 

<213> Homo sapiens 
<400> 71 

agtaacaaca taccctgcct gatattttcc ttctgagact ttggcatagg acccacgaac 60 

aaaaagtatc aactcaggat tatccaatgg agcatctcat aaatcaacac aaggggctac 120 

tagtttggat actacaccta cacaattgtg atctttacca cagtcagtca gaggtaatgg 180 

agtagcaggg ttaagtaggt tttagatgga gtagcatttt agatggaggt cagaaggagg 240 

caggagaaaa tttcataaga tcataagatg ttagttttct tgctgaaaaa tgctgagctt 300 

99ttggaatt tagtagactt tccacagcat gtggaatttg caaattaagt tcattcccta 360 

aaaccagctc agatgaaact tgtagcaact tggtggctgc tgctgcttct attttttttt 420 

ttttttttaa gacacaggat ctgtcttagg cttcctttag tggtgaaaca gtgtggccta 480 

atgggaggag gcttattggt agactaacag agaagcagac aactcttttc cagtgtcctg 540 

cttatttgca aggaaggcag acatctcggg gaaaagaatt tcttgttcta ggatctatct 600 

cttggttgtg atttaaaata aaaaagaagg ttcctttggt ctcagcccct gtaactgttg 660 
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taattggtga gacataagct tggtagtctt ttgggttttt tcttgctcca gagtcctctc 720 
aaaatgttca gctaaggcca ccaattcagt catgtctg 758 



<210> 72 
<211> 673 
<212> ADN 

<213> Homo sapiens 
<400> 72 

caggttgagc ccttgaaaaa cacaaaaagg acaagttcct gtgttgaaac acccccatcc 60 
cctcacgtcc tcacccccag gcccagaagt aggttgcaac tgcctttgga agattttgcc 120 
ccttagccat ccccacccac ttgtaccagc taagaatgct ggagactctg ccaccatgct 180 
ctgcgtgccc ctgaacctct gtgcagcccg gaaggctgat gtacaggtgt acctcaatcc 240 
acattacagc catgctccta atgtacatgg acatttttgt aactcagctc atattctgac 300 
tgtatttgag aagctggctg tttaagggaa cccagaagtg aattcttttg taaagtaaag 360 
cacccttttg taatgcaatt aattatccct taatgtatct gttttgtaag tctgcatttt 420 
tgtatatcgg atttacctta agcttctcta gtgaggcatt ctgagcagtg gtgatcacat 480 
gccagatccg gccctgccna tccacaaaag tagatganca atgcacgctc ctcaaacatc 540 
tttggaggaa ctacctgggc canancactg gccagggtgg cagcaagcag cagcaggggc 600 
tgacagcagg gtttactgnc attcaacatt gcttganatt gcctctaatg ttctgnatta 660 
aangaaaaac cat 673 



<210> 73 
<211> 554 
<212> ADN 

<213> Homo sapiens 
<400> 73 

aaagggggaa aggaaactac tttaagagcc ccctttttcn tcccnaactc caaatttttg 60 

aaaggggaaa aaacnggaaa accccacccc agttccttcc agaaaaatgc cttttcctag 120 

gncattaaat acctaccttt acctacccta anactgntta agntaaatcc ctttccttta 180 

ccccacccta aactanccca ttctaanccc ggantccctc actctttttt tttagttact 240 

aatcatttta tgaaaataat gtatttataa gtattttcct taaggtttgt gaagagtatt 300 

tgcantgtgt ccttcatttt natgtgtttg cnannnctcc gctccaggaa gaacggaaat 360 

gctgtcttgt gagcatgaag tgaacgggct gttttgctcc agccactttt cttgtacaac 420 

cacatggatg gattagatgt cctcaggtct tttccatctt cagtttctat gactgtggaa 480 

taaatgttca gatagaaact tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtacctcggc 540 
cgcgaccacg ctaa 554 



<210> 74 
<2ll> 1794 
<212> ADN 

<213> Homo sapiens 
<400> 74 
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gttctcaccc caggcccaga agtaggtcgc aactgccttt ggaagatttt gccccttagc 60 
catccccacc cacttgtacc agctaagaat gctggagact ctgccaccat gctctgcgtg 120 
cccctgaacc tctgtgcagc ccggaaggct gatgtacagg tgtacctcaa tccacattac 180 
agccatgctc ctaatgtaca tggacatttt tgtaactcag ctcatattct gactgtattt 240 
gagaagctgg ctgtttaagg gaacccagaa gtgaattctt ttgtaaagta aagcaccctt 300 
ttgtaatgca attaattatc ccttaatgta tctgttttgt aagtctgcat ttttgtatat 360 
cgggtttacc ttaagcttct ctagtgaggc attctgagca gtggtgatca catgccagat 420 
cgccctgcct atccacaaag tagatgacca atgcacgctc ctcaaacatc tttggaggaa 480 
ctacctggcc aaaacactgg ccaggatgca gcaagcagca gcaggggctg acagcaggct 54 0 
tactgccatc aacattgctt gaaatgcctc tatgttctga ataaagaaaa accataattg 600 
cttgtggtga aacgaagcag tcttcatgtt aagtagcaat ggttattttt attggtagta 660 
actgaacagt gttttgcaat ttgtgaaaca gtgtattgtg ttttgtaaaa tgatgtcatg 720 
aaatggtggg tccttggaaa cctcctttcc gttcagctct gcctctgttc tttcaactcc 780 
tttgaggctc aaaaaaaaca caaagatcag aagccttcag atagagggtg gtattctggt 840 
aaagaagaaa gagataaggg acgctacctt gcttttctgg cacaggaagc acatgataaa 900 
gcatgctcag atgagctgga acagatatag ctacctggtt cgtgtaaata agaataatca 960 
aggccccaga gtgtgtatgc ttccaggtgg aggagaaagg ggaatctccc aaaatttaaa 1020 
aacaaattgg aagaataacc aggacagcca agtgaagcag ccacagggac ccaagcagtc 1080 
gaggtcttta atgtgcctgg agatgactct ctgctattca tgaatcttgc tattgcacaa 1140 
accctatcaa gagctgctgc ttcccttcca gccagaaaag tggtaagcgg agcaagtgcc 1200 
aagcagaaca gaccttatca tctgggtaac agacttctca gtgttggtgc tgtgtctgtt 1260 
agagccttag agcaagttaa gcacttcctt ggtgtgggta aagaataaag .gggaaagaaa 1320 
ctactttaga gcctcttttt ctcccaactc atatttttga taggaaaaac agaaaaccca 1380 
tccagttctt cagaaattgc tttctaggca ttaatactac tttactatct atactgttta 1440 
gttattcctt tctttaccca cctaaactat ccatctaatc caggattccc tcactctttt 1500 
tttttagtta ctaatcattt tatgaaaata atgtatttat aagtattttc ttaaggtttg 1560 
tgaagagtat ttgcattgtg tcttcatttt aatgtgtttg caatcgctcc gctccaggaa 1620 
gaacggaaat gctgtcttgt gagcatgaag tgaacgggct gttttgcaat ccagccactt 1680 
ttcttgtaca accacatgga tggattagat gtcctcaggt cttttccatc ttcagtttct 1740 
atgactgtgg aataaatgtt cagatagaaa cttcaaaaaa aaaaaaaaaa aaaa 1794 



<210> 75 
<211> 507 
<212> ADN 

<213> Homo sapiens 
<400> 75 

aagaaatgat tgaaatgttt caaggggaca tggagctgaa aggtggaatg agagacttcc 60 
gtttgggcta taagcttgtg gttttatttg accttttaaa ctcagcactt acactacttt 120 
atttctaaat gttctatgaa ggaataagag tttgtagaac aaaagagaag ggctaaaaga 180 
gagaccagtt agaaagaggt ggagagtcag aactggagtg caaaagcaca aagattccag 240 
ggcatacaag gatgataaat cacttccaca aatgagcgca aagggatatt gtgtacaatg 300 
cttccatgaa ggaaagaggg gcactggatt aggtacccac ctgggtttga attgaacaac 360 
tactgttttt cccaagcttt tgtgtttgac agtttttaac cctttggcat gttccatttt 420 
cccgggggng ttgaggaccn tttaggagct tgggatgcct taagtcccgt taacnttaag 480 
ttttctttcc ccccaaaggn gggttna 507 
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<210> 76 
<211> 415 
<212> ADN 

<213> Homo sapiens 
<400> 76 

ttttttttaa tatttcgatg acatgttgaa tgcatataag aggttagagt gaacaaggaa 60 

gttaagggct ttcttttttc aaaatcatat ttgcatttaa cttgaaattc cttccagtca 120 

tacgattttt gcataaatat ttatgggatc ttgatggcta attagattat aagtctttta 180 

tccaggaatt tgtctaattt tatgctctcc atcaaacctg agctctgtgc tgatcttcag 240 

tccatgttaa acaaaattat tttaacaccc tttaaggctg catttcaaat tctctcattt 300 

gttactcata ctatgtcatg ggaatatata gtctttattt ttgggatgaa agtttgaaga 360 

cccaaatccc ccaaaaattg gatttcccnt gtggaaagct ctcattttgg atcca 415 



<210> 77 
<211> 1318 
<212> ADN 

<213> Homo sapiens 
<400> 77 

ggagctgaaa ggtggaatga gagacttccg 

accttttaaa ctcagcactt acactacttt 

tttgtagaac aaaagagaag ggctaaaaga 

aactggagtg caaaagcaca aagattccag 

atgagcgcaa agggatattg tgtacaatgc 

cccacctggt tgaaatgaac aactactgta 

ttgcatgtca ttttccaggg agtgagacct 

agtttcttcc acaaagagga tttattttgc 

tgtactaaga aaaatttgat ggcagtgata 

gagaatgcta agtgtagatg aaaaggcctc 

tgcctggaga cagcttgagc ctctagaaat 

ccatctgaat aattgcaagt tgaccttcct 

acttggttgg agaataattt ttccttagtt 

tttctcctcc ttactttctt tcacagtaaa 

gttgtggaga ccacatgaag acattgatgt 

catttgtgcc ttttgctttc tttgcttttg 

caaaatgaga gctttcacat gggaaatcaa 

atccaaaaat aaagactata tattccgtga 

aaatgcagcc ttaaagggtg ttaaaataat 

gagctcaggt ttgatggaga gcataaaatt 

ctaattagcc atcaagatcc cataaatatt 

tcaagttaaa tgcaaacatg attttgaaaa 



tttgggctat aagccttgtg gttttatttg 60 
atttctaaat gttctatgaa ggaataagag 120 
gagaccagtt agaaagaggt ggagagtcag 180 
gcatacaagg atgataaatc acttccacaa 240 
ttccatgaag aaagagggca ctgataggta 300 
ttccaagctt tgtgttgaca gttttaacct 360 
ttagagctgg atgcttaagt ctgtaactta 420 
tttttgtgac atgatggtgc tagaacaaaa 480 
gcattatctt gagggataaa gaagtggagt 54 0 
ttcaaaaccc atttggattt gtaaagtgca 600 
gagaagaaca atgggagaat ggttttattc 660 
ccaactagaa aagtggggtt gtgtctgagg 720 
gcttcatgat actgaacagg tcacttagcc 780 
atgagatggt aatctccact tctaagggtt 840 
aactctgcct ggcagatgat gtaaagtgcc 900 
aggcatttgg cacttttatt attctttgat 960 
tttttggggg atttgggtct tcaaactctc 1020 
catagtatga gtaacaaatg agagaatttg 1080 
tttgtttaac atggactgaa gatcagcaca 1140 
agacaaattc ctggataaaa gacttataat 1200 
tatgcaaaaa tcgtatgact ggaaagaatt 1260 
aagaaagccc ttaacttcct tgttcact 1318 



<210> 
<211> 



78 
530 
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<212> ADN 

<213> Homo sapiens 
<400> 78 

tagtctccac aatattgtca gactgatctc 
actttaaact tccagtagct cccggattca 
agcacttaag accatttcca agggagtggc 
tgtctacatg ggatgcacag gcaaagcttg 
tgccctgtga tcctcctagg aacatgggca 
aggtcgtttt ctcatctgcc tctatcttgt 
tattaactcc caggtttcca gaggaacatg 
gtagggtcag gaactgcagn tctattaggc 
ccagcattag gggtgtattc acaantttgc 



tgcaaaactc aaaagtcaaa ttactcttct 60 
tttaagggta gaatctaaat cctttggcat 120 
tctaccatgg agccctagag actctacatg 180 
gactgccata tgacctaaat ctgggtggaa 24 0 
agggaggaaa tcttcagaga aggcttcgcg 300 
ggggatgctg ccatgaggcg gttttctgga 360 
gaggatttcc aacttaaccc natggtttcc 420 
ctttaggngg cagtctggga tttgacntgg 480 
tgnaggcctt ttgaccctat 530 



<210> 79 
<211> 495 
<212> ADN 

<213> Homo sapiens 
<400> 79 

ctgtatttgt atagagcaga aaatggatag tcagataaag aagcagactt tcacaatatc 60 
atatgttaat tttgtaatga gatagttgtt tagactagta aatagatcag ggttaaaggc 120 
tttgattgaa tcagattatg aaaggtgcca aacacaaagg accgtccaag tctaacactt 180 
acagattcag ctggtaaaga aataatgaac taattttaga ttcagccaga ttattactta 240 
tatacatagg tgaaggaaaa gagaagctaa aggtgtcagc cctatgagtc cttatcccac 300 
acaccaaaag ggtgggcact ggaaacaaan ggggtcagnt gggcttcagc nangngttgt 3 60 
ggatacaccc tnttgctggc cngtcnattc cagactggca gctaantggc tatagagctg 420 
cagttctgcc ccacgggngc ctaggggtta agttgggagt ctcntgttcc cctgggccng 480 
gggtttatat cngtt 495 



<210> 80 
<211> 594 
<212> ADN 

<213> Homo sapiens 
<400> 80 

catttaaggg tagaatctaa atcctttggc atagcactta agaccatttc caagggagtg 60 

gctctaccat ggagccctag agactctaca tgtgtctaca tgggatgcac aggcaaagct 120 

tggactgcca tatgacctaa atctgggtgg aatgccctgt gatcctccta ggaacatggc 180 

aagggaggaa atcttcagag aaggcttcgc gaggttgttt tctcatctgc ctctatcttg 240 

tgggatgctg ccatgaggcg gttttctgat ataactccca ggttccagag gaacatgaga 300 

cttccaactt aacccctatg cttccgtagg gcagaactgc agctctatag ccatttagct 360 

gcagtctgga attgactggc cagcaatagg gtgtatcaca actcttgctg aagccatctg 420. 

accccttttg tttcagtgcc atccttttgg tgtgtgggat aaggactcat agggctgaca 480 

tctttagctt ctcttttctt cactatgtat ataagtaata atctggctga atctaaaatt 540 

agttcattat ttctttacca gctgaatctg taagtgttag acttggacgg tcct 594 
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<210> 81 
<211> 582 
<212> ADN 

<213> Homo sapiens 
<400> 81 

gttttctgga agtagggaga aaatcagagg ctaaagagtt tgaaaatgtg cacagaacag 60 
tttgagctca aaatgccact cctaccttat tttgccaggt gattatcaat tcaccacaat 120 
tcccacagga aatgagaggc attatctttt gccaaataga acttgatagg ctattaactt 180 
gggtaccctg ggcctggagg aggatggaaa taagatagaa gactaaaaac aggatactaa 240 
gtggaagtct gaataaaagg ggatgaactc caactcctat cccaccatgt ggcgtgcctc 300 
tgcctgctcg ccagtaatgg tagccaggct tatatccccc atgctgacta gaacatcctt 360 
ctctggggaa attaaagagc agacctctgg agaaattaca cttctcaaag aaaaattaac 420 
aggcactgac atttagggtc ccaaaggcaa aaagtaggtc acactcaaag catctaactc 480 
aaagaccctg gacttcagtt gtagaccctg agcagattag actttggatt gtctcccttg 540 
ggtaaaatac agtggtctcc ccttattcaa agtttcactt tc 582 



<210> 82 
<211> 321 
<212> ADN 

<213> Homo sapiens 
<400> 82 

agtaaggctt ggcagttgac cttgtttgtt ggagagaagg gataagattt taaagctaca 60 
tgtctgaaag aatgatgctg ctgattgaaa taaaggaaga aaggatgcat ttcgggctcc 120 
aacctgtcct aggaaggcct agacctcaaa caccaacacc tccatgcatt tcctctttgg 180 
ctactatgtc ttttccctga cttctgcctc tccagctctc tgggctgctg cttccacctg 240 
ttcatctgac ttagaccctc cctgctgggc ccttgttcac ctactcattt ggtgcttcgt 300 
ctgccatcag tacctccatt g 321 



<210> 83 
<211> 545 
<212> ADN 

<213> Homo sapiens 
c400> 83 

gtcaattaca tcagcacttg gactggacca gggaaaggaa tgattctgct tcctgggaat 60 
gtcagaagga cctgatgatt atatttggca aagccaggag gagtggcttt gaatgtcatt 120 
gctaagaatt acactttgag tagcatttct ggatgtctga gcttttcaaa tgatacttct 180 
tttctgctgt ggctttcctt tctgttggac tggttcccag agggtcctct tgtttgtcct 240 
tgccctcgct tttatatcag ttcatgtttt ctcttctgtc atcttccttc ccagcgctgt 300 
ttctccaccc cctcccgctg cactcacaac agcttcccct ctcctgttta gaggtggaag 360 
catgtaagaa tgcgtttgag ggggatgctt gccaaaggac agcatattca acatctggta 420 
tcaacaaggt aacgtttaac cttagactag ccaaactagt gatgacctgc ttccatgctg 480 
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catctgctgc tttttgtgtt gatgggactc agaaatcatg agaaaggtct tcagtgatcc 540 
atgac 545 



<210> 84 
<211> 183 
<212> ADN 

<213> Homo sapiens 
<400> 84 

caccaaagct gaagtctctc acttaatcct aagcaagggg ctagggagaa ctaagatatc 60 
cttcccatat caagggatat aggttactag aagggtggag gtctcttaac aggctcactc 120 
acctttcaga gttcaaatta tggtcaggct taagaagctc tctcttgtga ctgagtgtat 180 
tgc 183 



<210> 85 

<211> 843 

<212> ADN 

<213> Homo sapiens 

<400> 85 

ggaatggaca tgaagaggat ttcacagtat 
tttggcttgg agcttattaa gttttgacta 
aaacacactt ttgttagtat tggaactttc 
tatatatttt ttaacatttc ctatatatct 
tattaaggga gactctttaa aatcaacttt 
agctaaagtt ttggaataat ttatattaaa 
acataaaaag gattttggct tcttttt tga 
catatactag atctgtgacc gctacacaaa 
tctttataaa ataagtgtaa gttgttcagc 
aatgaaatgg agtatgtgaa attgcttcag 
gttgttttta gctaataatg gatttaagtg 
taaagcgtgt gcttaaagtg gtatcaccag 
accccaatta aaatgttctt taatattcat 
tattttctca agcctattac tctagagctg 
gtg 



gtagagcaga aggcacgtga atgtgtttgc 60 

cggttaaaat aagtcaaata gtaagtggta 120 

tggagaacat aagggctatg agaatgcata 180 

aaggtaccaa agcactgagt ctaatttacc 240 

ataactaatt catactataa gacagataat 300 

agccgcaagt cttaaaaatc cctggatatg 360 

agtatttaaa attaatcacc ttagctctac 420 

ttgtttatca tctttgggtc tctattgcct 480 

ctgcctcaca gggctgttgt gaggaaataa 540 

caacagcaaa gtgctacgta aatgtaaagt 600 

tttggataat tgtagatgca tttactttga 660 

tgatttctaa catgatttta aaaaaataaa 720 

ttaatttgtg catgacttgt ggcctttttg 780 

taaaagctct tgcacagcat tgttgtgtca 840 

843 



<210> 86 
<211> 613 
<212> ADN 

<213> Homo sapiens 
<400> 86 

aggttatcca cttttgctga agatattttt tattgaatca aagattgagt tacaattata 60 
cttttcttac ctaagtggat aaaatgtact tttgatgaat cagggaattt ttttaaagtt 120 
ggagtttagt tctaaattga ctttacgtac tactgcagtt aattcctttt ttggctaggg 180 
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atggtttgat aaaccacaat tggctgatat tgaaaatgaa agaaacttaa aaggtgggat 240 

ggatcatgat tactgtcgat aactgcagat aaatttgatt agagtaataa ttttgtcatt 300 

taaaaacaca gttgtttata ctgcccatcc taggatgctc accttccaag attcaacgtg 360 

gctaaaacat cttctggtaa attgtgcgtc catattcatt ttgtcagtag ccaggagaaa 420 

tggggatggg ggaaatacga cttagtgagg catagacatc cctggtccat cctttctgtc 480 

tccagctgct tcttggaacc tgctctcctg cttgctggtc cctgacgcag agaccgttgc 540' 

ctcccccaca gccgtttgac tgaaggctgc tctggagacc tagagtaaaa cggctgatgg 600 
aagttgtggg acc 613 



<210> 87 
<211> 705 
<212> ADN 

<213> Homo sapiens 
<400> 87 

gctaatgttt cttgctgggt aattattagc ataaatatca ggttcttaga ggtctttaag 60 

agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct gaaataccag 120 

gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc tgccccattg 180 

ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt ggaaccctcc 240 

gagccagaaa gaagcattcc agcatgattc ctcagatgca atgaggaagg tttacagaat 300 

tttcacaggg caacagagat caagcggtat gaaaaggtag gagttttaag ctcaagtctc 360 

aaagataacc tacctttaca ttctcagtca gaatttgacc cagaaagagg aagtttcttc 420 

aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga gtacagaact 4 80 

tggtcataat atcttgcatc ttatagattt attaaagatt agtttcaagt tcacattcgc 540 

tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc acacaggtat 600 

gctcctctct tttctgagag agaaggcatg ggattttcag cataaattcc atgttatgtg 660 

agtgctgttt gagttctgaa gttcctatca atatctgttc ctgca 705 



<210> 88 
<211> 459 
<212> ADN 

<213> Homo sapiens 
<400> 88 

cccgttgctc agtttagggc actactctta aaaaaggaaa gttaacaaac tggaatagag 60 
tcagagataa ctttgagaaa accgatgtca ttaaactggt gtctctggac ctgaggtttg 120 
cactcacatc tccatctggc ggccccataa gcaatctgtc ctacagataa ctcgtcctac 180 
acaaaactta gtctcttttc agctcagctc tctcactctc aattatatct ccttacttcc 240 
atatggcact gttgtacact catttactca gagccagaaa cgtcagcgtc atcttggatt 300 
tttcttatgc tctttctctc tctagtcata tgccagactt taaactctgc ttgaaagctt 360 
tctcataagc tctttccttt tccctttcta ctgctttgca tttgctactt aacccttttc 420 
ttcaggctgt ttgctttcca gtccatcgtt cgctctgct 459 



<210> 
<211> 



89 
775 
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<212> ADN 

<213> Homo sapiens 
<400> 89 

tctatccgtc cgcgtcagcg ccttgccacc 
agtggcacta acgtg'ggatc ctcagggcgc 
gcgggatcca ctgtccggca gaggtaagga 
agataggacc cagaacctcg ctgattctgg 
aaggcaaaat gagcttctag tgacgtggcc 
aggcgacatt ttttttctcg ttgctcagtt 
acaaactgga atagagtcag agataacttt 
ctggacctga ggtttgcact cacatttcca 
agataactcg tcctacacaa aacttagtct 
atatctcctt acttccatat ggcactgttg 
agcgtcatct tggatttttc ttatgctctt 
ctctgcctga aagctttctc ataagctctt 
ctacttaacc cttttcttca ggctgtttgc 



ctcatctcca atatgcctgg tccgaccccc 60 
tctcccagca aagcagtggc cgcccgggcg 120 
accctgcagt tcgttcgctt ccagactcgg 180 
ggtggagacc ctagcatgtg aagattgaca 240 
gcgggagtag ttaaaggcct tttgggagga 300 
tagggcacta ctcttaaaaa aggaaagtta 360 
gagaaaaccg atgtcattaa actggtgtct 420 
tctggcggcc ccataagcaa tctgtcctac 480 
cttttcagct cagctctctc actctcaatt 540 
tacactcatt tactcagagc cagaaacgtc 600 
tctctctcta gtcatatgcc agactttaaa 660 
tccttttccc tttctactgc tttgcatttg 720 
tttccagtcc atcgttcgct ctgct 775 



<210> 90 
<211> 727 
<212> ADN 

<213> Homo sapiens 
<400> 90 

gaatgctgtt acctgaaccc cttacttcga 
tttggacttt ttgctactga catttttgta 
acgccatact tcctgactgt gtgcaagcca 
caccagttta taaacaatgg gaacatttgt 
cggagatcct ttccctccaa acacgctgct 
atgtatatta caagcacaat caagacgaag 
ctcggaactc tctgcacagc cttcctgaca 
cactgctcgg acgtgattgc tggtttcatc 
atgtgtgtgg ttcataactt taaaggaacg 
gatccccgtg gagtacccct aatggctttc 
agtgcacaga atcactctgc gtccatgacc 
agctgttttt taaaatcatc ttccaattct 
aaactgt 



aggatcataa gattcacagg ggtgtttgca 60 
aacgccggac aagtggtcac tgggcactta 120 
aactacacca gtgcagactg ccaagcgcac 180 
actggggacc tggaagtgat agaaaaggct 240 
ctgagcattt actccgcctt atatgccacg 300 
agcagtcgac tggccaagcc ggtgctgtgc 360 
ggcctcaacc gggtctctga gtatcggaac 420 
ctgggcactg cagtggccct gtttctggga 480 
caaggatctc cttccaaacc caagcctgag 54 0 
ccaaggatag aaagccctct ggaaacctta 600 
gaagttacct gagacgactg atgtgtcaca 660 
atacttcaaa acacacagtt gctcaatgtc 720 

727 



<210> 91 
<211> 478 
<212> ADN 

<213> Homo sapiens 
<400> 91 

cagtttttat cacaggtgca agccgtggca ttggcaaagc tattgcattg aaagcagcaa 60 
aggatggagc aaatattgtt attgctgcaa agaccgccca gccacatcca aaacttctag 120 
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gcacaatcta tactgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 180 

ttgttgatgt gagagatgaa cagcagatca gtgctgcagt ggagaaagcc atcaagaaat 240 

ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300 

acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360 

catctaaagc atgtattcct tatttgaaaa agagcaaagt tgctcatatc ctcaatatca 420 

gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgc 478 



<210> 92 
<211> 679 
<212> ADN 

<213> Homo sapiens 
<400> 92 

gccaggaaac agcaaatcca atagatccga ctttatcagg ctgggctctc gcttcagatt 60 

cagtgggcgg acagaatatc aagctacaca tggctccagg ttacgaagaa ccagcacctt 120 

tgagaggaag cctagtaaac gttatccatc ccggagacat tcaacgttca aagcaagcaa 180 

cccagtgata gcagcccagc tctgctctaa aacaaatcca gaagtccata attaccagcc 240 

tcaatatcat cctaatatcc atcccagcca gccccggtgg catcctcact ctccaaatgt 300 

caggccatcc tttcaggatg acaggtcgca ttggaaagca tcggccagtg gagatgacag 360 

ccattttgat tatgtccacg accagaacca gaagaactta ggagggatgc aaagtatgat 420 

gtatcgagat aaactcatga ctgcactttg agagactgaa gcatctctct tccattcacc 480 

ttcatagttt cattgcattc catgaaaagt gtcttggcct cagatggatg gatgtgtttg 540 

gacgagtgtc tttaaggagt agtcctgaaa ggtgtttttg gtgtccatgt aaatatttga 600 

agataaaacc actatagctt gtcataattt actgttgact gcattctcat taaaatgaag 660 
gtaaaggctc aggaatcat 679 



<210> 93 
<211> 691 
<212> ADN 

<213> Homo sapiens 
<400> 93 

ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60 
atgtctattg cctggagtca tccctgcaga cctacaaccc agactacgtc ctgatggtag 120 
aagacgatgc tgtaccagaa gagcagatct tcccagtctt ggagcacctt ctgcgggctc 180 
gcttctctga gccacatccc agagatgccc tttatctcaa gctgtatcac cccgagaggc 240 
tccagcacta catcaatcca gagcccatgc ggatcctgga atgggttggt gtaggcatgt 300 
tgctggggcc cttactaacc tggatataca tgaggtttgc cagccgccca gggtttagct 360 
ggcctgtaat gctct.tcttc tccctgtata gcatgggtct ggtggagctg gtgggtcggc 420 
actatttcct ggaactgcgg cggctgagtc cttccctgta cagtgtggtt cctgcctctc 480 
agtgttgcac cccagccatg ctcttcccgg cacctgcggc ccgccggacc ctcacctacc 540 
tgtcccaagt gtactgccac aagggctttg gcaaggacat ggcactgtac tcgctgttga 600 
gggccaaggg agagagggcc tatgtagtgg agccgaacct cgtgaaacac atcgggctct 660 
tctccagtct ccggtacaac tttcatccca g 691 



WO 00/71710 



70 



PCT/FROO/01426 



<210> 94 
<211> 451 
<212> ADN 

<213> Homo sapiens 
<400> 94 

caactttctc cattcccagc tgggccccat 
ggagtcacca taaggagaaa actcaggaat 
tgtgcaatga acttgagact cctgatgtac 
atctgtgaat cttggctggg acttcctctg 
attgactgca agagaatctc tgcaacctcc 
gaatccattc tttacaatat gcagtgagat 
atgaaggagg tcattgaaaa agagaacagt 
aacagtactt ttcctataat tagttgatat 



tcctggattt aagatggtgg ctatccctga 60 
tctgagtctt ccctgctaca ggaccagttc 120 
actgtgatat tgaccgaagg ctacatacag 180 
agtgatgcct gagggtcagc tcctctagac 240 
tatataaaag catttctgtt aattcattca 300 
gggcttaagt ttgggctaga gtttgacttt 360 
gacgtaggca aatgtttcaa gcactttaga 420 
a 451 



<210> 95 
<211> 662 
<212> ADN 

<213> Homo sapiens 
<400> 95 

ggacctttgc tgctgttgga cactccgtca ccttttggaa cacaagtata tcaagatagt 60 

ggctactgat gttcaagtgg gattgaagtg tgataaatgg atatattttg ttgtttgctg 120 

gggtgttcat ggagatgtta agagattgag gccctgggct gagggtatat aatgtatgtc 180 

aggtaaagtt tgaagactgc caaggagcag attttctccc tggaaatgtg aaaactgaac 240 

ctataactct gataaggact tgagatgtgt agaaacgttg ggttatggaa gactagtttc 300 

ttccataacc ctgaattgga gaccttaatg ctaagtgtag attattgagg tttgttagtg 360 

aggaaaagaa taagagctca gaagcctttg ttatcagata gcgaaatcag ggcctagtga 420 

ggagcacagg tcgactacat aatggagtcc attggcgaac cctattgcaa tttggtccaa 480 

ctatatcttc tggtgaagga aattaatgat gtaagaaaat gcaagaggct caacttctct 540 

tccaaaaatc ttctggcttc tgaactcttc ctctgcctct ctttaaataa ataacacaga 600 

atttcaagtg gtaggagact tattaagcca gtcaccaagc ttggtctgtc agcctgtctt 660 
ct 662 



<210> 96 
<211> 766 
<212> ADN 

<213> Homo sapiens 
<400> 96 

ctatcctttc agcccaccaa cttagcggca gcactaggga ttcattataa ggtaaatctg 60 
gtttacataa agacctgaag gaggcctgta tttgaagctc acacttggta ttggtatctc 120 
tcatttttac tgagccagtg cggaatacca ctgtatgtac tcatataagc ccttgacttt 180 
tactgctcat caggattgga atattactct agcagtcttc acacataggc aagttacagt 240 
ccttttaaaa agnatctcat ttccctataa tggaacctaa tagccaactt tttcatagaa 300 
attgctagaa gagttcgatc aactataaat gataaagtgt ttataagcat agtcagtgtg 360 
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acacagaaac caatcttaaa attgaattta 
tccatgtctt atttttactg caacaagtta 
aaatttgtgg gccctcattt ggataaaggc 
cataatctga gaatttctct gtagagcaga 
gtaaaaaacg catttatatc aaaccttaga 
gatgcttttt attgtttcag tttttaaaat 
taccaatggg ttgcaaccct tagcttgaaa 



atgttttatc atatcagatt aaatattttc 420 

gaaagtggga acactttgat taatgtctta 480 

agcaatccta aggacttttt ttttttttaa 540 

gactttcaaa ccttttggct gtaacccaca 600 

atatgtttaa tgaacaatac ttaccattct 660 

atgccagttg caacccacta aattgatatc 720 

aaaacaccct cacaga 766 



<210> 97 
<211> 584 
<212> ADN 

<213> Homo sapiens 



<400> 97 

agttgatcga ttcatgtcgt attgatagaa 
tatagtttca agaaatgtgt ttttaaattt 
ataaagcaac cccctaacca caaaatatcc 
aatacacaca tatttttaca tagctatgat 
tcggcctaac acttgtctcc tcttgtcaac 
tttatatcca tgtaacatgg gtaacctcac 
tctaattttt cactcttata aatagtgctg 
ctccttcttt tggattattc ccttaggaat 
gcatgaagta ttttatagct cttgttttat 
tctttgggtt ggaaggacct taaaggtcat 



tcttgaccag aagaaatttt gctcttttta 60 

ttattaatgc acttgaacaa ctttgcagga 120 

ctctaaatta gttccctagc tttctcaatg 180 

cgttgtgtac attctccttt gttttacttc 240 

acagattcta ctctcaccaa tttaaatgtc 300 

ttcaccccat tattagatat ttgagttata 360 

ctatgaatgt ctgtaaaaaa aaaaaaactg 420 

atctccaaag agggattaca aggtcaaaga 4 80 

attgccagat tgctttctag aaagatccaa 54 0 

ctagtttagc ctcc 584 



<210> 98 

<211> 1251 

<212> ADN 

<213> Homo sapiens 



<400> 98 

gtgtgtagca gcgtgtccaa ggcaagaact 
agagataaat ggttcagccc tatgtagcta 
tccaaaatct tctgttctct gccccaaact 
cttccatcgc tgtgctcctg tgaacatttc 
cacctttgtc agtgacaata gtgtcttaca 
agaaattata ttgggacttt gcttgttatc 
aatcaggtat atatcaagag tacttgtgtg 
acttggaggc acaggtgtac tatggtggct 
aaccgttact cccgagcagc ttcagatagc 
tgccatttca gctacagtgt tcacagtgat 
acgtgttgct cttaccatcg ccttgttcca 
actgctagtc ttccaaccct tctggacttt 
gatcatgaca cttctttttc ttggcactac 
t^tggagttc aaaatttctg ggcctctgca 
gatttggatc agtgaattta ttctagcatg 



gaaaactctg agtgatgttc agaagtttgc 60 
cancctaaag ccttctgaat acactacatc 120 
accagttcca gcgagtgcac ctattccatt 180 
ctgctatgcc aagtttgcag aggccctgat 240 
caggctgatt agcggagtaa tgaccagcaa 300 
actagttcta tccatgattt tgatggtgat 360 
gatcttaacg attctggtca tactcggttc 420 
gtatgcaaag caaagaaggt ctcccaaaga 480 
tgaagacaat cttcgggccc tcctcattta 540 
cttattcctg ataatgttgg ttatgcgcaa 600 
cgcagctggc aaggtcttca ttcacttgcc 660 
ctttgctctt gtcttgtttt gggtgtactg 720 
cggcagtcct gttcagaatg agcaaggctt 780 
gtacatgtgg tggtaccatg tggtgggcct 840 
tcagcagatg acagtggcag gagctgtggt 900 
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aacatactat tttactaggg ataaaaggaa 
aaatcgcctt attcgttacc acctaggtac 
agtcaaaatt ccgcgaatga tccttatgta 
tgcttgtgca cgatgtgtgc tgaaatcttg 
cctaaattat ttaaatcaga atgcatacac 
cacctcagca aaggatgcct ttgtcattct 



tttgccattt acacctattt tggcatcagt 960 

ggtggcaaaa ggatctttca ttatcacatt 1020 

tattcacagt cagctcaaag gaaaggaaaa 1080 

catttgttgc ctttggtgtc ttgaaaagtg 1140 

agccacagct atcaacagca ccaacttctg 1200 

ggtggagaat gctttgcgag t 1251 



<210> 99 

<211> 710 

<212> ADN 

<213> Homo sapiens 

<400> 99 

tttgatcctc cagtgtgact gttgtttttg tttgggggtg ggttggggtt ttttgctttt 60 

tattcctgaa gcttaccaga tatgaatggc taatactcca ttgttctgct tgttgtaatg 120 

gtgaatgctt taagaaaaaa aagtgtaatt tgctaagaat aattcatgat ctgtttatgc 180 

gataactcct ttttgttaca atttttttaa aaaaagctat ttttgttaat gtaaagtaaa 240 

tatttcagag caaatttttt aaacttattg cactaaatac aggctctgta caaaaaaaaa 300 

aaaaaaaaaa aaaagcctca gcattttatc attccatgga aggagaatct tttgaaagaa 360 

agcattgcct cctaccagaa ctagacagtg aattagatcg gtattatgga aatgcataca 420 

agtaatgtca ctagggctta ataagcagcc gtttgctaat gtgcttcctt .tcaaagggtt 480 

ggacctttaa attgctgcaa aaggtaaatt gtattttttt ttaagtattg gtgttcttta 540 

ctctagctag gctaaaattt gctaaatgcc ttggtttctt ttaaaagttc atgtaatatt .600 

tctgattttt cagaatattt gcaataagag tctggatttt aaaaaacaca tgcatacaca 660 

caattaagag ctcatgtctt agcaagatct gggaaaccaa cattgcgaga 710 



<210> 100 
<211> 580 
<212> ADN 

<213> Homo sapiens 
<400> 100 

aggttcctgt agtctgtgct cagaacttgg tttttggccc ctattgtttt tgcctatttt 60 
gattttcaga gatgatcaca tggggacagt taacttttct tctgctgtgt tgccttaatg 120 
ctactagatt gtgttgtgtt gttggagttt tctgacttct tccctataaa aagatactga 180 
gagctccata atgaaagaag ttgttatact ttctcagaat attctggacc actgaatgca 240 
cttctaatag agctttaatc taaagaagtt agttcagtgg ttattaactg attttattac 300 
aggagaaaaa aactttaaca aaaaggcagg gagaaaagtg tgaagggcat caagcaaaat 360 
gacaggggct tcaaaaaaca accaaagaca aaaccctatc ttctgaagac caaaggtcca 420 
actttactta ctggctggca cagcctttct gaactccttg agtttagaat agagctccta 480 
gaataataag gcggccaaat tttaaagatc agtcaataca gtagggacct gctattgatc 540 
tctcaggcac cgagttcttc acatccagtg tcaagcccag 580 



<210> 101 
<211> 223 
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<212> ADN 

<213> Homo sapiens 
<400> 101 

atgacagaga tttgccttcc agggggtcta atttgaagag gaaagtaatt taaatgtata 60 
ggtttatata atagcattgt atttttctct attttattca ttctttcatt ctcttcgatg 120* 
actcccagca cctgcgcgtc catcttcatt cttagccaat gacctttcct tttacttaac 180 
agagaaaata acaatcagaa gagtcttcat aagttcccac ccc 223 



<210> 102 
<211> 19 
<212> ADN 

<213> Homo sapiens 
<400> 102 

ctcctttccc accagacac 19 



<210> 103 
<211> 20 
<212> ADN 

<213> Homo sapiens 
<400> 103 

cattccaagg ttcccttttt 20 



<210> 104 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 104 

agctcctctt gcctaagtgg tc 22 



<210> 105 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 105 

gtttgtgtgg ttctgttttc ca 22 



<210> 
<2ll> 



106 
19 
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<212> ADN 

<213> Homo sapiens 
<400> 106 

aaccctgtgc tgatctccc 19 

<210> 107 
<211> 18 
<212> ADN 

<213> Homo sapiens 
<400> 107 

gtgcttcaaa ggcttcaa 18 



<210> 108 
<211> 17 
<212> ADN 

<213> Homo sapiens 
<400> 108 

tcagtggaaa gaaatgt 



<210> 109 
<211> 18 
<212> ADN 

<213> Homo sapiens 
<400> 109 

atggggacga tttcagtg 18 



<210> 110 
<211> 21 
<212> ADN 

<213> Homo sapiens 
<400> 110 

ctgctgtcta ttgggaaagt t 21 



<210> in 
<2ll> 20 
<212> ADN 

<213> Homo sapiens 
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<400> 111 

agaagcagtg gacaggggag 20 



<210> 112 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 112 

ctggttgaac ctgtggattg eg 22 



<210> 113 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 113 

tggagagcag cttccaaaaa tc 22 



<210> 114 
<211> 18 
<212> ADN 

<213> Homo sapiens 
<400> 114 

caatgcacct gtcagggg 18 



<210> 115 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 115 

tgttggacct ggtactctcc ac 22 



<210> 116 

<211> 18 

<212> ADN 

<213> Homo sapiens 



<400> 116 

gggcaaatgg ggaaacat 



18 
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<210> 117 
<211> 19 
<212> ADN 

<213> Homo sapiens 
<400> 117 

gggaagacag gggaaagag 19 

<210> 118 
<211> 22 
<212> ADN 

<213> Homo sapiens 
<400> 118 

ccattgactc ctccttcttt ct 22 

<210> 119 
<211> 19 
<212> ADN 

<213> Homo sapiens 
<400> 119 

agtaacaaca taccctgcc !9 

<210> 120 
<211> 21 
<212> ADN 

<213> Homo sapiens 
<400> 120 

cagacatgac tgaattggtg g . '21 

<210> 121 
<211> 20 
<212> ADN 

<213> Homo sapiens 
<400> 121 

aaacaccccc atcccctcac 20 



<210> 122 
<211> 19 
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<212> ADN 
<213> Homo 

<400> 122 

ggggctgaca 

<210> X23 
<211> 20 
<212> ADN 
<213> Homo 

<400> 123 
aaaccccacc 



sapiens 
gcagggttt 

sapiens 
ccagttcctt 



<210> 124 

<211> 21 

<212> ADN 

<213> Homo sapiens 

<400> 124 

gaagtgaacg ggctgttttg c 

<210> 125 
<211> 19 
<212> ADN 

<213> Homo sapiens 
<400> 125 

ggagctgaaa ggtggaatg 



<210> 126 

<211> 22 

<212> ADN 

<213> Homo sapiens 

<400> 126 

agtgaacaag gaagttaagg gc 22 



<210> 127 

<211> 21 

<212> ADN 

<213> Homo sapiens 



WO 00/71710 



78 



PCT/FROO/01426 



<400> 127 

cccggattca tttaagggta g 21 



<210> 128 

<211> 18 

<212> ADN 

<213> Homo sapiens 

<400> 128 

cacaaaggac cgtccaag 18 

<210> 129 
<211> 461 
<212> PRT 
<213> Homo sapiens 

<400> 129 

Met Asp Ser Gin Lys Tyr Cys Phe Lys Glu Asn Glu Asn Val Thr Val 
1 5 10 15 

Asp Lys Ala Cys Phe Leu He Ser Asn He Thr He Gly Pro Glu Ser 
20 25 30 

He Asn Leu Gin Gin Glu Ala Leu Gin Arg He He Ser Thr Leu Ala 
35 40 45 

Asn Lys Asn Asp Glu He Gin Asn Phe He Asp Thr Leu His His Thr 
50 55 60 

Leu Lys Gly Val Gin Glu Asn Ser Ser Asn lie Leu Ser Glu Leu Asp 
65 70 75 . 80 

Glu Glu Phe Asp Ser Leu Tyr Ser He Leu Asp Glu Val Lys Glu Ser 
85 90 95 

Met He Asn Cys He Lys Gin Glu Gin Ala Arg Lys Ser Gin Glu Leu 
100 105 no 

Gin Ser Gin He Ser Gin Cys Asn Asn Ala Leu Glu Asn Ser Glu Glu 
115 120 125 

Leu Leu Glu Phe Ala Thr Arg Ser Leu Asp lie Lys Glu Pro Glu Glu 
130 135 140 

Phe Ser Lys Ala Ala Arg Gin lie Lys Asp Arg Val Thr Met Ala Ser 
145 150 155 160 
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Ala Phe 

Leu Met 

Phe Leu 

Val Ala 
210 

Asn Lys 
22S 

Gly Leu 

He Lys 

Tyr Met 

Tyr Ser 
290 

Asp Asn 
305 

Glu Trp 
Lys Glu 
Arg Ser 



Arg.Leu Ser Leu Lys Pro Lys Val Ser Asp Asn Met Thr His 

170 175 

Val Asp Phe Ser Gin Glu Arg Gin Met Leu Gin Thr Leu Lys 
18 <> 185 iso 

Pro Val Pro Lys Ala Pro Glu He Asp Pro Val Glu Cys Leu 
195 200 205 

Asp Asn Ser Val Thr Val Ala Trp Arg Met Pro Glu Glu Asp 
215 220 

He Asp His Phe lie Leu Glu His Arg Lys Thr Asn Phe Asp 
23 ° 235 240 

Pro Arg Val Lys Asp Glu Arg Cys Trp Glu He He Asp Asn 
245 250 255 

Gly Thr Glu Tyr Thr Leu Ser Gly Leu Lys Phe Asp Ser Lys 
260 265 270 

Asn Phe Arg Val Arg Ala Cys Asn Lys Ala Val Ala Gly Glu 
275 280 285 

Asp Pro Val Thr Leu Glu Thr Lys Ala Leu Asn Phe Asn Leu 
295 300 

Ser Ser Ser His Leu Asn Leu Lys Val Glu Asp Thr Cys Val 
310 315 320 

Asp Pro Thr Gly Gly Lys Gly Gin Glu Ser Lys He Lys Gly 
3 25 330 335 

Asn Lys Gly Ser Val His Val Thr Ser Leu Lys Lys His Thr 
340 345 350 

Gly Thr Pro Ser Pro Lys Arg Thr Ser Val Gly Ser Arg Pro 
3 55 360 365 



Pro Ala 
370 

Val Leu 
385 

Lys Ala 



Val Arg Gly Ser Arg Asp Arg Phe Thr Gly Glu Ser Tyr Thr 
375 380 

Gly Asp Thr Ala He Glu Ser Gly Gin His Tyr Trp Glu Val 
390 395 400 

Gin Lys Asp Cys Lys Ser Tyr Ser Val Gly Val Ala Tyr Lys 
405 410 415 
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Thr Leu Gly Lys Phe Asp Gin Leu Gly Lys Thr Asn Thr Ser Trp Cys 
420 425 430 

lie His Val Asn Asn Trp Leu Gin Asn Thr Phe Ala Ala Lys His Asn 
435 440 445 

Asn Lys Val Lys Ala Leu Asp Val Thr Val Leu Lys Lys 
450 455 460 



<210> 130 
<2ll> 32 
<212> PRT 

<213> Homo sapiens 
<400> 130 

lie Lys Asn lie He Leu Ser Val Ser Leu Trp Ser Lys Met Phe Met 
15 10 15 

Val Glu Thr Gly Asp Leu Ala Ala Ser Leu Thr Thr Phe Ser. Lys Cys 
20 25 30 



<210> 131 
<211> 183 
<212> PRT 

<213> Homo sapiens 
<400> 131 

Asn He He Gly Gin Ser Val Glu Glu Ala He Arg Gly Val Phe Asp 
15 10 15 

Ala Ser Leu Lys Met Ala Gly Phe Tyr Gly Leu Tyr Thr Trp Leu Thr 
20 25 30 

His Thr Met Phe Gly He Asn lie Val Phe He Pro Ser Ala Leu Ala 
35 40 45 

Ala He Leu Gly Ala Val Pro Phe Leu Gly Thr Tyr Trp Ala Ala Val 
50 55 60 

Pro Ala Val Leu Asp Leu Trp Leu Thr Gin Gly Leu Gly Cys Lys Ala 
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65 



70 



75 



80 



He Leu Leu Leu He Phe His Leu Leu Pro Thr Tyr Phe Val Asp Thr 
85 90 95 

Ala He Tyr SerAsp He Ser Gly Gly Gly His Pro Tyr Leu Thr Gly 
100 105 HO 

Leu Ala Val Ala Gly Gly Ala Tyr Tyr Leu Gly Leu Glu Gly Ala He 
115 120 125 

He Gly Pro He Leu Leu Cys lie Leu Val Val Ala Ser Asn He Tyr 
130 135 140 

Ser Ala Met Leu Val Ser Pro Thr Asn Ser Val Pro Thr Pro Asn Gin 
i45 150 155 160 

Thr Pro Trp Pro Ala Gin Pro Gin Arg Thr Phe Arg Asp He Ser Glu 
165 170 175 



Asp Leu Lys Ser Ser Val Gly 
180 



<210> 132 

<211> 291 

<212> PRT 

<213> Homo sapiens 

<400> 132 

Met Asp Ser Pro Trp Asp Glu Leu Ala Leu Ala Phe Ser Arg Thr Ser 
1 5 10 15 

Met Phe Pro Phe Phe Asp He Ala His Tyr Leu Val Ser Val Met Ala 
20 25 30 

Val Lys Arg Gin Pro Gly Ala Ala Ala Leu Ala Trp Lys Asn Pro He 
35 40 45 

Ser Ser Trp Phe Thr Ala Met Leu His Cys Phe Gly Gly Gly He Leu 
50 55 60 

Ser Cys Leu Leu Leu Ala Glu Pro Pro Leu Lys Phe Leu Ala Asn His 
6 5 70 75 80 

Thr Asn He Leu Leu Ala Ser Ser He Trp Tyr He Thr Phe Phe Cys 
85 90 95 
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Pro His Asp Leu Val Ser Gin Gly Tyr Ser Tyr Leu Pro Val Gin Leu 
. 100 105 . no 

Leu Ala Ser Gly Met Lys Glu Val Thr Arg Thr Trp Lys He Val Gly 
115 120 125 

Gly Val Thr His Ala Asn Ser Tyr Tyr Lys Asn Gly Trp He Val Met 
130 135 140 

He Ala He Gly Trp Ala Arg Gly Ala Gly Gly Thr He He Thr Asn 
145 150 155 160 

Phe Glu Arg Leu Val Lys Gly Asp Trp Lys Pro Glu Gly Asp Glu Trp 
165 170 175 

Leu Lys Met Ser Tyr Pro Ala Lys Val Thr Leu Leu Gly Ser Val lie 
180 185 190 

Phe Thr Phe Gin His Thr Gin His Leu Ala He Ser Lys His Asn Leu 
195 200 205 

Met Phe Leu Tyr Thr lie Phe He Val Ala Thr Lys He Thr Met Met 
210 215 220 

Thr Thr Gin Thr Ser Thr Met Thr Phe Ala Pro Phe Glu Asp Thr .Leu 
225 230 235 240 

Ser Trp Met Leu Phe Gly Trp Gin Gin Pro Phe Ser Ser Cys Glu Lys 
245 250 255 

Lys Ser Glu Ala Lys Ser Pro Ser Asn Gly Val Gly Ser Leu Ala Ser 
260 265 270 

Lys Pro Val Asp Val Ala Ser Asp Asn Val Lys Lys Lys His Thr Lys 
2? 5 280 285 

Lys Asn Glu 
290 



<210> 133 

<211> 48 

<212> PRT 

<213> Homo sapiens 



<400> 133 
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Ser lie Arg Pro Arg Gin Arg Leu 
1 5 

Gly Pro Thr Pro Ser Gly Thr Asn 
20 

Ser Lys Ala Val Ala Ala Arg Ala 
35 40 



Ala Thr Leu lie Ser Asn Met Pro 
10 15 

Val Gly Ser Ser Gly Arg Ser Pro 
25 30 

Ala Gly Ser Thr Val Arg Gin Arg 
45 



<210> 134 
<211> 22 
<212> PRT 

<213> Homo sapiens 
<400> 134 

Asn Lys Thr Gin Arg Pro Cys Ala Gin Gin His Ser Arg Met Pro Pro 
1 5 io is 

lie Pro Arg Phe Pro Phe 
20 



<210> 135 

<211> 95 

<212> PRT 

<213> Homo sapiens 

<400> 135 

Met Trp Asp Phe Arg Ala Arg lie Phe Asn Ser Gin Gin Tyr Trp Lys 
1 5 10 15 

Leu Arg Leu Gin Asn Pro Gly Met Glu Gly Arg Glu Phe Glu Leu Cys 
20 25 30 

Ser Leu His Arg Met Gly Ser Gin Glu Asn Ala Asn Val Lys Leu Ser 
35 40 45 

Tyr Arg Glu Val Ser He Asn Leu His Arg Thr Pro Thr Lys Asp Thr 
50 55 60 

Leu Arg Glu Lys Val Cys Ser Pro Lys Tyr Thr Ser Leu Phe Asn Leu 
65 70 75 80 
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Leu Pro Lys lie Arg Glu Asn Ala Asp Thr Ala Gly Lys Arg Ser 
85 90 95 



<210> 136 
<211> 108 
<212> PRT 

<213> Homo sapiens 
<400> 136 

Leu Lys Thr His Phe Pro Pro Cys Pro Arg His Lys Phe lie Leu Met 

Leu He Leu Gin Ser Leu Arg Tyr His Ala Ser Tyr Arg Asp He Leu 
20 25 30 

Asp Asp Leu Leu His Gin Asp Arg He Gly Gin His Met Ser Pro Glu 
35 40 45 

Gly Cys Met Leu Lys Gin Gin Ser Lys Gin Leu Ala His Asn Arg Gin 
50 55 60 

Leu Leu Arg Pro Asn Ser Val His Pro Gin Ala Leu Gin His Gin Pro 
65 70 75 80 

Glu Asp Ser Arg Gin Glu Ser Gin Asp Gly Asp Thr Asp Pro Pro Gin 
85 90 95 

Leu Val Pro Thr He Thr Glu Thr Glu Met Ser Gin 
100 105 



<210> 137 
<211> 213 
<212> PRT 

*213> Homo sapiens 
<400> 137 

Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg He He Arg Phe Thr 
15 10 15 

Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp He Phe Val Asn Ala 
20 25 30 



Gly Gin Val Val Thr Gly His Leu Thr Pro Tyr Phe Leu Thr Val Cys 
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35 

Lys Pro Asn Tyr 
50 

Asn Asn Gly Asn" 
65 

Arg Arg Ser Phe 



Leu Tyr Ala Thr 
100 

Arg Leu Ala Lys 
115 

Leu Thr Gly Leu 
130 

Val lie Ala Gly 
145 

Met Cys Val Val 



Pro Lys Pro Glu 
180 

He Glu Ser Pro 
195 

Met Thr Glu Val 
210 



40 

Thr Ser Ala Asp 
55 

He Cys Thr Gly 
70 

Pro Ser Lys His 
85 

Met Tyr He Thr 



Pro Val Leu Cys 
120 

Asn Arg Val Ser 
135 

Phe He Leu Gly 
150 

His Asn Phe Lys 
165 

Asp Pro Arg Gly 



Leu Glu Thr Leu 
200 

Thr 



Cys Gin Ala His 
60 

Asp Leu Glu Val 
75 

Ala Ala Leu Ser 
90 

Ser Thr He Lys 
105 

Leu Gly Thr Leu 



Glu Tyr Arg Asn 
140 

Thr Ala Val Ala 
155 

Gly Thr Gin Gly 
170 

Val Pro Leu Met 
185 

Ser Ala Gin Asn 



45 

His Gin Phe He 



lie Glu Lys Ala 
80 

lie Tyr Ser Ala 
95 

Thr Lys Ser Ser 
110 

Cys Thr Ala Phe 
125 

His Cys Ser Asp 



Leu Phe Leu Gly 
160 

Ser Pro Ser Lys 
175 

Ala Phe Pro Arg 
190 

His Ser Ala Ser 
205 



<210> 138 
<211> 325 
<212> PRT 

<213> Homo sapiens 
<400> 138 

Met Ala Val Gly Asn Asn Thr Gin Arg Ser Tyr Ser lie lie Pro Cys 
15 10 15 



Phe lie Phe Val Glu Leu Val lie Met Ala Gly Thr Val Leu Leu Ala 
20 25 30 
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Tyr Tyr Phe Glu Cys Thr Asp Thr Phe Gin val His He Gin Gly Phe 
35 40 45 

Phe Cys Gin Asp Gly Asp Leu Met Lys Pro Tyr Pro Gly Thr Glu Glu 
50 55 go 

Glu Ser Phe He Thr Pro Leu Val Leu Tyr Cys Val Leu Ala Ala Thr 
65 70 75 80 

Pro Thr Ala He lie Phe He Gly Glu He Ser Met Tyr Phe lie Lys 
85 90 95 

Ser Thr Arg Glu Ser Leu He Ala Gin Glu Lys Thr He Leu Thr Gly 
"0 105 no 

Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg He He Arg Phe Thr 
115 120 125 

Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp He Phe Val Asn Ala 
130 135 140 

Gly Gin Val Val Thr Gly His Leu Thr Pro Tyr Phe Leu Thr Val Cys 
145 150 155 160 

Lys Pro Asn Tyr Thr Ser Ala Asp Cys Gin Ala His His Gin Phe He 
165 170 175 

Asn Asn Gly Asn He Cys Thr Gly Asp Leu Glu Val He Glu Lys Ala 
180 185 190 

Arg Arg Ser Phe Pro Ser Lys His Ala Ala Leu Ser He Tyr Ser Ala 
195 200 205 

Leu Tyr Ala Thr Met Tyr He Thr Ser Thr He Lys Thr Lys Ser Ser 
21 0 215 220 

Arg Leu Ala Lys Pro Val Leu Cys Leu Gly Thr Leu Cys Thr Ala Phe 
225 230 235 240 

Leu Thr Gly Leu Asn Arg Val Ser Glu Tyr Arg Asn His Cys Ser Asp 
245 250 255 

Val He Ala Gly Phe He Leu Gly Thr Ala Val Ala Leu Phe Leu Gly 
260 265 270 

Met Cys Val Val His Asn Phe Lys Gly Thr Gin Gly Ser Pro Ser Lys 
275 280 285 
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Pro Lys Pro -Glu Asp Pro Arg Gly Val Pro Leu Met Ala Phe Pro Arg 
290 295 300 

He Glu Ser Pro Leu Glu Thr Leu Ser Ala Gin Asn His Ser Ala Ser 
305 310 315 320 

Met Thr Glu Val Thr 
325 



<210> 139 
<211> 406 
<212> PRT 

<213> Homo sapiens 
<400> 139 

Val Phe He Thr Gly Ala Ser Arg Gly He Gly Lys Ala He Ala Leu 
1 5 io 15 

Lys Ala Ala Lys Asp Gly Ala Asn He Val He Ala Ala Lys. Thr Ala 
20 25 30 

Gin Pro His Pro Lys Leu Leu Gly Thr He Tyr Thr Ala Ala Glu Glu 
35 40 45 

He Glu Ala Val Gly Gly Lys Ala Leu Pro Cys He Val Asp Val Arg 
50 55 60 

Asp Glu Gin Gin He Ser Ala Ala Val Glu Lys Ala He Lys Lys Phe 
65 70 75 80 

Gly Gly He Asp He Leu Val Asn Asn Ala Ser Ala lie Ser Leu Thr 
85 90 95 

Asn Thr Leu Asp Thr Pro Thr Lys Arg Leu Asp Leu Met Met Asn Val 
100 105 no 

Asn Thr Arg Gly Thr Tyr Leu Ala Ser Lys Ala Cys He Pro Tyr Leu 
H5 120 125 

Lys Lys Ser Lys Val Ala His He Leu Asn He Ser Pro Pro Leu Asn 
130 135 140 

Leu Asn Pro Val Trp Phe Lys Gin His Cys Ala Tyr Thr He Ala Lys 
145 150 155 160 
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Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly 
165 170 175 

Glu He Ala Val Asn Ala Leu Trp Pro Lys Thr Ala lie His Thr Ala 
180 185 190 

Ala Met Asp Met Leu Gly Gly Pro Gly He Glu Ser Gin Cys Arg Lys 
195 200 205 

Val Asp He He Ala Asp Ala Ala Tyr Ser He Phe Gin Lys Pro Lys 
210 215 220 

Ser Phe Thr Gly Asn Phe Val He Asp Glu Asn He Leu Lys Glu Glu 
225 230 235 240 

Gly He Glu Asn Phe Asp Val Tyr Ala He Lys Pro Gly His Pro Leu 
245 250 255 

Gin Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val Ser Lys Lys 
260 265 270 

Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gin 
275 280 285 

Leu Gin Pro Lys Pro Arg Ser Gly Ala Val Glu Glu Thr Phe Arg He 
290 295 300 

Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gin Ala He 
305 310 315 320 

Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp 
325 330 335 

Leu Lys Ser Lys Gly Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gin 
340 345 350 

Ala Asp Val Val Met Ser Met Thr Thr Asp Asp Phe Val Lys Met Phe 
355 360 365 

Ser Gly Lys Leu Lys Pro Thr Met Ala Phe Met Ser Gly Lys Leu Lys 
370 375 380 



He Lys Gly Asn Met Ala Leu Ala He Lys Leu Glu Lys Leu Met Asn 
385 390 395 400 



Gin Met Asn Ala Arg Leu 
405 
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<210> 140 
<211> 422 
<212> PRT 
<213> Homo sapiens 

<400> 140 

Ser Thr Lys Val Met Leu Pro Asn Thr Gly Arg Leu Ala Gly Cys Thr 
15 10 15 

Val Ph'e lie Thr Gly Ala Ser Arg Gly lie Gly Lys Ala lie Ala Leu 
20 25 30 

Lys Ala Ala Lys Asp Gly Ala Asn He Val He Ala Ala Lys Thr Ala 
35 40 45 

Gin Pro His Pro Lys Leu Leu Gly Thr He Tyr Thr Ala Ala Glu Glu 
50 55 60 

He Glu Ala Val Gly Gly Lys Ala Leu Pro Cys He Val Asp Val Arg 
65 70 75 80 

Asp Glu Gin Gin He Ser Ala Ala Val Glu Lys Ala He Lys Lys Phe 
85 90 95 

Gly Gly He Asp He Leu Val Asn Asn Ala Ser Ala He Ser Leu Thr 
100 105 HO 

Asn Thr Leu Asp Thr Pro Thr Lys Arg Leu Asp Leu Met Met Asn Val 
115 120 125 

Asn Thr Arg Gly Thr Tyr Leu Ala Ser Lys Ala Cys He Pro Tyr Leu 
130 135 i4 0 

Lys Lys Ser Lys Val Ala His He Leu Asn He Ser Pro Pro Leu Asn 
145 150 155 160 

Leu Asn Pro Val Trp Phe Lys Gin His Cys Ala Tyr Thr He Ala Lys 
165 170 175 

Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly 
180 185 190 

Glu He Ala Val Asn Ala Leu Trp Pro Lys Thr Ala lie His Thr Ala 
195 200 205 

Ala Met Asp Met Leu Gly Gly Pro Gly He Glu Ser Gin Cys Arg Lys 
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210 



215 



220 



Val Asp He He Ala Asp Ala Ala Tyr Ser He Phe Gin Lys Pro Lys 
225 230 235 240 

Ser Phe Thr Gly -Asn Phe Val He Asp Glu Asn He Leu Lys Glu Glu 
245 250 255 

Gly He Glu Asn Phe Asp Val Tyr Ala He Lys Pro Gly His Pro Leu 
260 265 - 270 

Gin Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val Ser Lys Lys 
275 280 285 

Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gin 
290 295 300 

Leu Gin Pro Lys Pro Arg Ser Gly Ala Val Glu Glu Thr Phe Arg He 
305 310 315 320 

Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gin Ala lie 
325 330 335 

Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp 
340 345 350 

Leu Lys Ser Lys Gly Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gin 
355 360 365 

Ala Asp Val Val Met Ser Met Thr Thr Asp Asp Phe Val Lys Met Phe 
370 375 380 

Ser Gly Lys Leu Lys Pro Thr Met Ala Phe Met Ser Gly Lys Leu Lys 
385 390 395 400 

He Lys Gly Asn Met' Ala Leu Ala He Lys Leu Glu Lys Leu Met Asn 
405 410 415 



Gin Met Asn Ala Arg Leu 
420 



<210> 141 
<211> 424 
<212> PRT 

<213> Homo sapiens 
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<400> 141 

Thr Glu Val .Ser Val Asp Leu Pro Lys His Ala Lys Gly Gin Asp Leu 
1.5 10 15 

Phe Asp Gin lie Val Tyr His Leu Asp Leu Val Glu Thr Asp Tyr Phe 
20 - 25 30 

Gly Leu Gin Phe Leu Asp Ser Ala Gin Val Ala His Trp Leu Asp His 
35 40 45 

Ala Lys Pro He Lys Lys Gin Met Lys He Gly Pro Ala Tyr Ala Leu 
50 55 60 

His Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu 
65 70 75 80 

Glu Phe Thr Arg Tyr Leu Phe Val Leu Gin Leu Arg His Asp He Leu 
85 90 95 

Ser Gly Lys Leu Lys Cys Pro Tyr Glu Thr Ala. Val Glu Leu Ala Ala 
100 105 110 

Leu Cys Leu Gin Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His Thr 
115 120 125 

Pro Glu Leu Val Ser Glu Phe Arg Phe lie Pro Asn Gin Thr Glu Ala 
130 135 140 

Met Glu Phe Asp He Phe Gin Arg Trp Lys Glu Cys Arg Gly Lys Ser 
145 150 155 160 

Pro Ala Gin Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu 
165 170 175 

Met Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu 
180 185 ■ 190 

Tyr Ser Leu Gly Leu Thr Pro Thr Gly He Leu He Phe Glu Gly Ala 
195 2Q0 205 

Asn Lys He Gly Leu Phe Phe Trp Pro Lys He Thr Lys Met Asp Phe 
210 215 220 

Lys Lys Ser Lys Leu Thr Leu Val Val Val Glu Asp Asp Asp Gin Gly 
225 230 235 240 



Arg Glu Gin Glu His Thr Phe Val Phe Arg Leu Asp Ser Ala Arg Thr 
245 250 255 
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Cys Lys His Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg 
260 265 270 

Leu Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe He Arg 
275 * 280 285 

Leu Gly Ser Arg Phe Arg Phe Ser Gly Arg Thr Glu Tyr Gin Ala Thr 
290 295 300 

His Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser 
305 310 315 320 

Lys Arg Tyr Pro Ser Arg Arg His Ser Thr Phe Lys Ala Ser Asn Pro 
325 330 335 

Val He Ala Ala Gin Leu Cys Ser Lys Thr Asn Pro Glu Val His Asn 
340 345 350 

Tyr Gin Pro Gin Tyr His Pro Asn lie His Pro Ser Gin Pro Arg Trp 
355 360 365 

His Pro His Ser Pro Asn Val Arg Pro Ser Phe Gin Asp Asp Arg Ser 
370 375 380 

His Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val 
385 390 395 400 

His Asp Gin Asn Gin Lys Asn Leu Gly Gly Met Gin Ser Met Met Tyr 
405 410 415 



Arg Asp Lys Leu Met Thr Ala Leu 
420 



<210> 142 
<211> 455 
<212> PRT 

<213> Homo sapiens 
<400> 142 

Gly Pro Leu Leu Thr Gly Gly Ala Ala Val His He Ser Ala Ala Gly 
15 10 15 

Ala Ala Lys Ala Thr Leu Tyr Cys Arg Val Phe Leu Leu Asp Gly Thr 
20 25 30 



\ 
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Glu Val Ser Val Asp Leu Pro Lys His Ala Lys Gly Gin Asp Leu Phe 
35- 40 45 

Asp Gin He Val Tyr His Leu Asp Leu Val Glu Thr Asp Tyr Phe Gly 
50 55 60 

Leu Gin Phe Leu Asp Ser Ala Gin Val Ala His Trp Leu Asp His Ala 
65 70 75 80 

Lys Pro He Lys Lys Gin Met Lys He Gly Pro Ala Tyr Ala Leu His 
85 90 95 

Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu Glu 
100 105 110 

Phe Thr Arg Tyr Leu Phe Val Leu Gin Leu Arg His Asp He Leu Ser 
115 120 125 

Gly Lys Leu Lys Cys Pro Tyr Glu Thr Ala Val Glu Leu Ala Ala Leu 
130 135 140 

Cys Leu Gin Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His. Thr Pro 
145 150 155 160 

Glu Leu Val Ser Glu Phe Arg Phe He Pro Asn Gin Thr Glu Ala Met 
165 170 175 

Glu Phe Asp He Phe Gin Arg Trp Lys Glu Cys Arg Gly Lys Ser Pro 
180 185 190 

Ala Gin Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu Met 
195 200 205 

Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu Tyr 
210 215 220 

Ser Leu Gly Leu Thr Pro Thr Gly He Leu He Phe Glu Gly Ala Asn 
225 230 235 240 

Lys He Gly Leu Phe Phe Trp Pro Lys He Thr Lys Met Asp Phe Lys 
245 250 255 

Lys Ser Lys Leu Thr Leu Val Val Val Glu Asp Asp Asp Gin Gly Arg 
260 265 270 

Glu Gin Glu His Thr Phe Val Phe Arg Leu Asp Ser Ala Arg Thr Cys 
275 280 285 
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Lys His Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg Leu 
290 295 300 

Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe lie Arg Leu 
305 310 315 320 

Gly Ser Arg Phe Arg Phe Ser Gly Arg Thr Glu Tyr Gin Ala Thr His 
325 330 335 

Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser Lys 
340 345 350 

Arg Tyr Pro Ser Arg Arg His Ser Thr Phe Lys Ala Ser Asn Pro Val 
355 360 365 

He Ala Ala Gin Leu Cys Ser Lys Thr Asn Pro Glu Val His Asn Tyr 
370 375 380 

Gin Pro Gin Tyr His Pro Asn He His Pro Ser Gin Pro Arg Trp His 
385 390 395 400 

Pro His Ser Pro Asn Val Arg Pro Ser Phe Gin Asp Asp Arg Ser His 
405 410 415 

Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val His 
420 425 430 

Asp Gin Asn Gin Lys Asn Leu Gly Gly Met Gin Ser Met Met Tyr Arg 
435 440 445 



Asp Lys Leu Met Thr Ala Leu 
450 455 



<210> 143 
<211> 232 
<212> PRT 

<213> Homo sapiens 
<400> 143 

Glu Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu 
1 5 10 15 

Lys Gin Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gin Thr Tyr Asn 
20 25 30 

Pro Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gin 
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35 



40 



45 



lie Phe Pro Val Leu Glu His Leu Leu Arg Ala Arg Phe Ser Glu Pro 
50 55 60 

His Leu Arg Asp "Ala Leu Tyr Leu Lys Leu Tyr His Pro Glu Arg Leu 
65 70 75 80 

Gin His Tyr He Asn Pro Glu Pro Met Arg He Leu Glu Tip Val Gly 
85 90 95 

Val Gly Met Leu Leu Gly Pro Leu Leu Thr Trp He Tyr Met Arg Phe 
100 105 110 

Ala Ser Arg Pro Gly Phe Ser Trp Pro Val Met Leu Phe Phe Ser Leu 
115 120 125 

Tyr Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu 
130 135 140 

Leu Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gin 
145 150 155 160 

Cys Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr 
165 170 175 

Leu Thr Tyr Leu Ser Gin Val Tyr Cys His Lys Gly Phe Gly Lys Asp 
180 185 190 

Met Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val 
195 200 205 

Val Glu Pro Asn Leu Val Lys His He Gly Leu Phe Ser Ser Leu Arg 
210 215 220 



Tyr Asn Phe His Pro Ser Leu Leu 
225 230 



<210> 144 

<211> 263 

<212> PRT 

<2l3> Homo sapiens 



<400> 144 

Leu Phe Leu Cys Asn Val Glu Arg Ser Val Ser His Phe Asp Ala Lys 
15 10 15 
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Leu Leu Ser .Lys Tyr Val Pro Val Ala Asn Arg Tyr Glu Gly Thr Glu 
20 25 30 

Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu Lys 
35 ~ 40 45 

Gin Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gin Thr Tyr Asn Pro 
50 55 60 

Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gin He 
65 70 75 80 

Phe Pro Val Leu Glu His Leu Leu Arg Ala Arg Phe Ser Glu Pro His 
85 90 95 

Leu Arg Asp Ala Leu Tyr Leu Lys Leu Tyr His Pro Glu Arg Leu Gin 
100 105 no 

His Tyr He Asn Pro Glu Pro Met Arg He Leu Glu Trp Val Gly Val 
115 120 125 

Gly Met Leu Leu Gly Pro Leu Leu Thr Trp He Tyr Met Arg Phe Ala 
130 135 140 

Ser Arg Pro Gly Phe Ser Trp Pro Val Met Leu Phe Phe Ser Leu Tyr 
145 150 155 160 

Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu Leu 
165 170 175 

Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gin Cys 
180 185 190 

Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr Leu 
195 200 205 

Thr Tyr Leu Ser Gin Val Tyr Cys His Lys Gly Phe Gly Lys Asp Met 
210 215 220 

Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val Val 
225 230 235 240 

Glu Pro Asn Leu Val Lys His He Gly Leu Phe Ser Ser Leu Arg Tyr 
245 250 255 



Asn Phe His Pro Ser Leu Leu 
260 
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<210> 145 " 
<211> 68 
<212> PRT 

<213> Homo sapiens 
<400> 145 

Leu Tyr Ser Lys Leu Ala Leu Gin Gly Val Ser Ser Val Tyr Pro Ala 
15 10 15 

Pro Val Cys Leu Ala Thr Pro Phe Leu Gly Arg Val Asp Leu Ala Val 
20 25 30 

His Val lie Asp Gly His Ser Val Tyr Leu Asp Ser Phe Leu Phe Leu 
35 40 45 

Cys Gin Gin Val lie Gly Met Phe Gly Phe Lys Asn Met Ser Val Leu 
50 55 60 

Cys Asn Phe Met 
65 



<210> 146 
<211> 720 
<212> PRT 

<213> Homo sapiens 
<400> 146 

Thr Cys His Glu His Ala Thr Cys Gin Gin Arg Glu Gly Lys Lys He 
15 10 15 

Cys He Cys Asn Tyr Gly Phe Val Gly Asn Gly Arg Thr Gin Cys Val 
20 25 30 

Asp Lys Asn Glu Cys Gin Phe Gly Ala Thr Leu Val Cys Gly Asn His 
35 40 45 

Thr Ser Cys His Asn Thr Pro Gly Gly Phe Tyr Cys He Cys Leu Glu 
50 55 60 

Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr Phe He Pro Asn Asp Gly 
65 70 75 80 

Thr Phe Cys Thr Asp He Asp Glu Cys Glu Val Ser Gly Leu Cys Arg 
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85 



90 



95 



His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu Cys Tyr Cys 
100 105 110 

Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro Glu Pro Phe His Pro Thr 
115 120 125 

Thr Asp Ala Thr Ser Cys Thr Glu lie Asp Cys Gly Thr Pro Pro Glu 
130 135 140 

Val Pro Asp Gly Tyr He He Gly Asn Tyr Thr Ser Ser Leu Gly Ser 
145 150 155 160 

Gin Val Arg Tyr Ala Cys Arg Glu Gly Phe Phe Ser Val Pro Glu Asp 
165 170 175 

Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser Pro Lys Leu 
180 185 190 

His Cys Gin Glu He Asn Cys Gly Asn Pro Pro Glu Met Arg His Ala 
195 200 205 

He Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val Ala Arg Tyr 
210 215 220 

Val Cys Gin Glu Gly Phe Glu Ser Pro Gly Gly Lys He Thr Ser Val 
225 230 235 240 

Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr Cys Thr Glu 
245 250 255 

He Leu Thr Lys He Asn Asp Val Ser Leu Phe Asn Asp Thr Cys Val 
260 265 270 

Arg Trp Gin He Asn Ser Arg Arg He Asn Pro Lys He Ser Tyr Val 
275 280 285 

He Ser He Lys Gly Gin Arg Leu Asp Pro Met Glu Ser Val Arg Glu 
290 295 300 

Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu Val Cys Leu 
305 310 315 320 

Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn He Ser Thr Ala Pro 



325 



330 



335 



Pro Arg Arg Ser Met Pro Ala Val He Gly Phe Gin Thr Ala Gly Ser 
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340 



345 



350 



Arg AsnSer His Gly Arg Asn Thr His lie Lys Glu Val Asp Leu Leu 
355 360 365 

Glu Asp Asp Gly" Ser Phe Asn lie Ser lie Phe Asn Glu Thr Cys Leu 
370 375 380 

Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His Met Tyr Gin 
385 390 395 400 

Phe Thr Val Leu Gly Gin Arg Trp Tyr Leu Ala Asn Phe Ser His Ala 
405 410 415 

Thr Ser Phe Asn Phe Thr Thr Arg Glu Gin Val Pro Val Val Cys Leu 
420 425 430 

Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr Leu Leu Arg 
435 440 445 

Ser Pro Lys Arg His Ser Val Gin lie Thr He Ala Thr Pro Pro Ala 
450 455 460 

Val Lys Gin Thr He Ser Asn He Ser Gly Phe Asn Glu Thr Cys Leu 
465 470 475 480 

Arg Trp Arg Ser He Lys Thr Ala Asp Met Glu Glu Met Tyr Leu Phe 
485 490 495 

His He Trp Gly Gin Arg Trp Tyr Gin Lys Glu Phe Ala Gin Glu Met 
500 505 510 

Thr Phe Asn lie Ser Ser Ser Ser Arg Asp Pro Glu Val Cys Leu Asp 
515 520 525 

Leu Arg Pro Gly Thr Asn Tyr Asn Val Ser Leu Arg Ala Leu Ser Ser 
530 535 540 

Glu Leu Pro Val Val He Ser Leu Thr Thr Gin lie Thr Glu Pro Pro 
545 550 555 560 

Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Prp Leu Pro Arg 
565 570 575 

Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro He Ser Ser Tyr 
580 585 590 



Gin Val Leu Val Leu Pro Leu Ala Leu Gin Ser Thr Phe Ser Cys Asp 
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595 

Ser Glu Gly Ala Ser 
610 

Tyr Val Ala Ala" Glu 
625 

Glu He Pro He Gly 
645 

Pro Leu Lys Arg Gly 
660 

Glu Trp Asn Lys Val 
675 

Lys Asp Ser Ser Leu 
690 

Ser Leu Ala Val Val 
705 



600 

Ser Phe Phe Ser Asn Ala 
615 

Leu Leu Ala Lys Asp Val 
630 6 3 5 

Asp Arg Leu Tyr Tyr Gly 
650 

Ser Asp Tyr Cys He He 
665 

Arg Arg His Ser Cys Ala 
660 

Met Leu Leu Gin Met Ala 
695 

He He Leu Thr Phe Leu 
710 715 



605 

Ser Asp Ala Asp Gly 
620 

Pro Asp Asp Ala Met 
640 

Glu Tyr Tyr Asn Ala 
655 

Leu Arg He Thr Ser 
670 

Val Trp Ala Gin Val 
665 

Gly Val Gly Leu Gly 
700 

Ser Phe Ser Ala Val 
720 



<210> 147 
<211> 707 
<212> PRT 

<213> Homo sapiens 



<400> 147 
Thr Cys His Glu 
1 

Cys He Cys Asn 
20 

Asp Lys Asn Glu 
35 

Thr Ser Cys His 
50 

Gly Tyr Arg Ala 
65 



His Ala Thr Cys 
5 

Tyr Gly Phe Val 

Cys Gin Phe Gly 
40 

Asn Thr Pro Gly 
55 

Thr Asn Asn Asn 
70 



Gin Gin Arg Glu 
10 

Gly Asn Gly Arg 
25 

Ala Thr Leu Val 



Gly Phe Tyr Cys 
60 

Lys Thr Phe He 
75 



Gly Lys Lys He 
15 

Thr Gin Cys Val 
30 

Cys Gly Asn His 
45 

He Cys Leu Glu 



Pro Asn Asp Gly 
80 
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Thr Phe Cys -Thr Asp lie Asp Glu Cys Glu Val Ser Gly 
85 90 

His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu 
100 105 



Leu Cys Arg 
95 

Cys Tyr Cys 
110 



Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro Glu Pro Phe His Prp Thr 
115 120 125 

Thr Asp Ala Thr Ser Cys Thr Glu lie Asp Cys Gly Thr Pro Pro Glu 
130 135 140 



Val Pro Asp Gly Tyr lie lie Gly Asn Tyr Thr Ser Ser 
145 150 : 155 

Gin Val Arg Tyr Ala Cys Arg Glu Gly Phe Phe Ser Val 
165 170 

Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser 
180 185 

His Cys Gin Glu lie Asn Cys Gly Asn Pro Pro Glu Met 
195 200 205 

He Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val 
210 215 220 

Val Cys Gin Glu Gly Phe Glu Ser Pro Gly Gly Lys He 
225 230 235 

Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr 
245 250 

He Leu Thr Lys He Asn Asp Val Ser Leu Phe Asn Asp 
260 265 

Arg Trp Gin He Asn Ser Arg Arg He Asn Pro Lys He 
275 280 285 

He Ser He Lys Gly Gin Arg Leu Asp Pro Met Glu Ser 
290 295 300 

Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu 
^05 310 315 

Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn lie Ser 
325 330 



Leu Gly Ser 
160 

Pro Glu Asp 
175 

Pro Lys Leu 
190 

Arg His Ala 

Ala Arg Tyr 

Thr Ser Val 
240 

Cys Thr Glu 
255 

Thr Cys Val 
270 

Ser Tyr Val 
Val Arg Glu 



Val Cys Leu 
320 

Thr Ala Pro 
335 



WO 00/71710 



102 



PCT/FR00/01426 



Pro Arg Arg. Ser Met Pro Ala val He Gly Phe Gin Thr Ala Glu Val 
340 345 350 

Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn He Ser He Phe Asn Glu 
355 360 365 

Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His 
370 375 380 

Met Tyr Gin Phe Thr Val Leu Gly Gin Arg Trp Tyr Leu Ala Asn Phe 
385 390 395 400 

Ser His Ala Thr Ser Phe Asn Phe Thr Thr Arg Glu Gin Val Pro Val 
405 410 415 

Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr 
420 425 430 

Leu Leu Arg Ser Pro Lys Arg His Ser Val Gin He Thr He Ala Thr 
435 440 445 

Pro Pro Ala Val Lys Gin Thr He Ser Asn lie Ser Gly Phe Asn Glu 
450 455 460 

Thr Cys Leu Arg Trp Arg Ser He Lys Thr Ala Asp Met Glu Glu Met 
465 470 475 480 

Tyr Leu Phe His He Trp Gly Gin Arg Trp Tyr Gin Lys Glu Phe Ala 
485 490 495 

Gin Glu Met Thr Phe Asn lie Ser Ser Ser Ser Arg Asp Pro Glu Val 
500 505 510 

Cys Leu Asp Leu Arg Pro Gly Thr Asn Tyr Asn Val Ser Leu Arg Ala 
515 520 525 

Leu Ser Ser Glu Leu Pro Val Val lie Ser Leu Thr Thr Gin He Thr 
530 535 540 

Glu Pro Pro Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Pro 
545 550 555 560 

Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro He 
565 570 575 



Ser Ser Tyr Gin Val Leu Val Leu Pro Leu Ala Leu Gin Ser Thr Phe 
580 585 590 
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Ser Cys Asp .Ser Glu Gly Ala Ser Ser Phe Phe Ser Asn Ala Ser Asp 
595 600 60S 

Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu Ala Lys Asp Val Pro Asp 

610 ' 615 620 



Asp Ala Met Glu He Pro He Gly 
625 630 

Tyr Asn Ala Pro Leu Lys Arg Gly 
645 

He Thr Ser Glu Trp Asn Lys val 
660 



Asp Arg Leu Tyr Tyr Gly Glu Tyr 
635 640 

Ser Asp Tyr Cys He He Leu Arg 
650 655 

Arg Arg His Ser Cys Ala Val Trp 
665 670 



Ala Gin Val Lys Asp Ser Ser Leu Met Leu Leu Gin Met Ala Gly Val 
675 680 685 

Gly Leu Gly Ser Leu Ala Val Val He lie Leu Thr Phe Leu Ser Phe 
690 695 700 

Ser Ala Val 
705 



<210> 148 
<211> 713 
<212> PRT 
<213> Homo sapiens 



<400> 148 

Ser Leu Asp Val Cys Ala Thr Cys 
1 5 

Arg Glu Gly Lys Lys He Cys He 
20 

Gly Arg Thr Gin Cys Val Asp Lys 

35 40 

Leu Val Cys Gly Asn His Thr Ser 
50 55 

Tyr Cys He Cys Leu Glu Gly Tyr 
65 70 



His Glu His Ala Thr Cys Gin Gin 
10 15 

Cys Asn Tyr Gly Phe Val Gly Asn 
25 30 

Asn Glu Cys Gin Phe Gly Ala Thr 
45 

Cys His Asn Thr Pro Gly Gly Phe 
60 

Arg Ala Thr Asn Asn Asn Lys Thr 
75 80 
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Phe He Pro Asn Asp Gly Thr Phe Cys Thr Asp He Asp Glu Cys Glu 
85 90 95 

Val Ser Gly Leu Cys Arg His Gly Gly Arg Cys Val Asn Thr His Gly 
100 105 no 

Ser Phe Glu Cys Tyr Cys Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro 
115 120 125 

Glu Pro Phe His Pro Thr Thr Asp Ala Thr Ser Cys Thr Glu He Asp 
130 135 140 

Cys Gly Thr Pro Pro Glu Val Pro Asp Gly Tyr He He Gly Asn Tyr 
14 5 150 ■ 155 160 

Thr Ser Ser Leu Gly Ser Gin Val Arg Tyr Ala Cys Arg Glu Gly Phe 
165 170 175 

Phe Ser Val Pro Glu Asp Thr Val Ser Ser Cys Thr Gly Leu Gly Thr 
180 185 190 

Trp Glu Ser Pro Lys Leu His Cys Gin Glu He Asn Cys Gly Asn Pro 
195 200 205 

Pro Glu Met Arg His Ala He Leu Val Gly Asn His Ser Ser Arg Leu 
210 215 220 

Gly Gly Val Ala Arg Tyr Val Cys Gin Glu Gly Phe Glu Ser Pro Gly 
22 5 230 235 240 

Gly Lys He Thr Ser Val Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser 
245 250 255 

Thr Leu Thr Cys Thr Glu He Leu Thr Lys He Asn Asp Val Ser Leu 
260 265 270 

Phe Asn Asp Thr Cys Val Arg Trp Gin He Asn Ser Arg Arg He Asn 
275 280 285 

Pro Lys He Ser Tyr Val He Ser He Lys Gly Gin Arg Leu Asp Pro 
290 295 300 

Met Glu Ser Val Arg Glu Glu Thr Val Asn Leu Thr Thr Asp Ser Arg 
3 °5 310 315 320 

Thr Pro Glu Val Cys Leu Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val 
325 330 335 
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Asn lie Ser Thr Ala Pro Pro Arg Arg Ser Met Pro Ala Val lie Gly 
340 . 345 350 

Phe Gin Thr Ala Glu Val Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn 
355 360 365 

He Ser He Phe Asn Glu Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg 
370 375 380 

Lys Val Gly Ser Glu His Met Tyr Gin Phe Thr Val Leu Gly Gin Arg 
365 390 395 400 

Trp Tyr Leu Ala Asn Phe Ser His Ala Thr Ser Phe Asn Phe Thr Thr 
405 410 415 

Arg Glu Gin Val Pro Val Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp 
420 425 430 

Tyr Thr Val Asn Val Thr Leu Leu Arg Ser Pro Lys Arg His Ser Val 
435 440 445 

Gin He Thr He Ala Thr Pro Pro Ala Val Lys Gin Thr lie Ser Asn 
450 455 460 

He Ser Gly Phe Asn Glu Thr Cys Leu Arg Trp Arg Ser He Lys Thr 
465 470 475 480 

Ala Asp Met Glu Glu Met Tyr Leu Phe His He Trp Gly Gin Arg Trp 
485 490 495 

Tyr Gin Lys Glu Phe Ala Gin Glu Met Thr Phe Asn lie Ser Ser Ser 
500 505 510 

Ser Arg Asp Pro Glu Val Cys Leu Asp Leu Arg Pro Gly Thr Asn Tyr 
515 520 525 

Asn Val Ser Leu Arg Ala Leu Ser Ser Glu Leu Pro Val Val He Ser 
530 535 540 

Leu Thr Thr Gin He Thr Glu Pro Pro Leu Pro Glu Val Glu Phe Phe 
54 * 550 555 560 

Thr Val His Arg Gly Pro Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys 
565 570 575 



Glu Lys Asn Gly Pro He Ser Ser Tyr Gin Val Leu Val Leu Pro Leu 
580 585 590 
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Ala Leu Gin Ser Thr Phe Ser Cys Asp Ser Glu Gly Ala Ser Ser Phe 
595 600 605 

Phe Ser Asn Ala Ser Asp Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu 
610 615 620 

Ala Lys Asp Val Pro Asp Asp Ala Met Glu lie Pro He Gly Asp Arg 
625 630 635 640 

Leu Tyr Tyr Gly Glu Tyr Tyr Asn Ala Pro Leu Lys Arg Gly Ser Asp 
645 650 655 

Tyr Cys He He Leu Arg He Thr Ser Glu Trp Asn Lys Val Arg Arg 
660 665 670 

His Ser Cys Ala Val Trp Ala Gin Val Lys Asp Ser Ser Leu Met Leu 
675 680 685 

Leu Gin Met Ala Gly Val Gly Leu Gly Ser Leu Ala Val Val He He 
690 695 700 



Leu Thr Phe Leu Ser Phe Ser Ala Val 
705 710 



<210> 149 
<211> 170 
<212> PRT 

<213> Homo sapiens 
<400> 149 

Arg Ser Met Thr Val Gly Gly Ala Phe His Thr Thr Glu Ala Glu Ala 
1 5 .10 15 

Ser Ser Gin Ser Leu Thr Gin He Tyr Ala Leu Pro Glu He Pro Gin 
20 25 30 

Asp Gin Asn Ala Ala Glu Ser Trp Glu Thr Leu Glu Ala Asp Leu lie 
35 40 45 

Glu Leu Ser Gin Leu Val Thr Asp Phe Ser Leu Leu Val Asn Ser Gin 
50 55 60 

Gin Glu Lys He Asp Ser He Ala Asp His Val Asn Ser Ala Ala Val 
65 70 75 80 

Asn Val Glu Glu Gly Thr Lys Asn Leu Gly Lys Ala Ala Lys Tyr Lys 
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85 90 95 

Leu Ala Ala Leu Pro Val Ala Gly Ala Leu He Gly Gly Met Val Gly 
100 105 110 

Gly Pro He Gly Leu Leu Ala Gly Phe Lys Val Ala Gly He Ala Ala 
115 120 125 

Ala Leu Gly Gly Gly Val Leu Gly Phe Thr Gly Gly Lys Leu He Gin 
130 . 135 140 

Arg Lys Lys Gin Lys Met Met Glu Lys Leu Thr Ser Ser Cys Pro Asp 
145 150 155 160 

Leu Pro Ser Gin Thr Asp Lys Lys Cys Ser 
165 170 



<210> 150 
<211> 318 
<212> PRT 

<213> Homo sapiens 
<400> 150 

Val Glu Lys Thr Ala Val Thr Arg Glu Val He Gin His Phe Phe Arg 
15 10 15 

Met Ser Glu Asp Glu Glu Lys Val Lys Leu Arg Arg Leu Glu Pro Ala 
20 25 30 

He Gin Lys Phe He Lys He Val He Pro Thr Asp Leu Glu Arg Leu 
35 40 45 

Arg Lys His Gin He Asn He Glu Lys Tyr Gin Arg Cys Arg He Trp 
50 55 60 

Asp Lys Leu His Glu Glu His He Asn Ala Gly Arg Thr Val Gin Gin 
65 70 75 80 

Leu Arg Ser Asn He Arg Glu lie Glu Lys Leu Cys Leu Lys Val Arg 
85 90 95 

Lys Asp Asp Leu Val Leu Leu Lys Arg Met He Asp Pro Val Lys Glu 
100 105 110 



Glu Ala Ser Ala Ala Thr Ala Glu Phe Leu Gin Leu His Leu Glu Ser 
115 120 125 
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Val Glu Glu Leu Lys Lys Gin Phe Asn Asp Glu Glu Thr Leu Leu Gin 
130 • 135 140 

Pro Pro Leu Thr Arg Ser Met Thr Val Gly Gly Ala Phe His Thr Thr 
145 150 155 160 

Glu Ala Glu Ala Ser Ser Gin Ser Leu Thr Gin He Tyr Ala Leu Pro 
165 170 175 

Glu He Pro Gin Asp Gin Asn Ala Ala Glu Ser Trp Glu Thr Leu Glu 
180 185 190 

Ala Asp Leu He Glu Leu Ser Gin Leu Val Thr Asp Phe Ser Leu lieu 
195 200 205 

Val Asn Ser Gin Gin Glu Lys He Asp Ser He Ala Asp His Val Asn 
210 215 220 

Ser Ala Ala Val Asn Val Glu Glu Gly Thr Lys Asn Leu Gly Lys Ala 
225 230 235 240 

Ala Lys Tyr Lys Leu Ala Ala Leu Pro Val Ala Gly Ala Leu He Gly 
245 250 255 

Gly Met Val Gly Gly Pro He Gly Leu Leu Ala Gly Phe Lys Val Ala 
260 265 270 

Gly He Ala Ala Ala Leu Gly Gly Gly Val Leu Gly Phe Thr Gly Gly 
275 280 285 

Lys Leu He Gin Arg Lys Lys Gin Lys Met Met Glu Lys Leu Thr Ser 
290 295 300 

Ser Cys Pro Asp Leu Pro Ser Gin Thr Asp Lys Lys Cys Ser 
305 310 315 



<210> 151 

<2ll> 123 

<212> PRT 

<213> Homo sapiens 



<400> 151 

His Ser Arg Cys Ser Pro Pro Leu Ser Leu Pro Met Lys Glu Glu Thr 
15 10 15 
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Thr Gly Val Cys Met Tyr Pro Pro He Lys Thr Arg Leu He Lys Thr 

. 20 25 30 

Phe Pro Val Asp Thr Met Thr Pro Phe Pro Asp Thr Phe Thr Thr Gly 

35 40 45 

Pro Gin Phe Thr Ala Asp Phe Arg Asp Ser Lys Leu Gin Cys Cys Pro 

50 55 60 

Gly Pro Thr Ser Pro Leu He Pro Ala Ala Thr Leu Arg Pro Leu Thr 

65 70 75 80 

Glu Thr Val Ser Thr Val Gin Thr He Tyr Thr Thr Arg Lys Pro Val 

85 90 95 

Ser Leu Ala Ala Ser Ala Glu Thr Leu Arg Gin Glu Leu Glu Arg Glu 

100 105 110 



Lys Met Met Lys Arg Leu Leu Met Thr Glu Leu 
115 120 



<210> 152 
<211> 58 
<212> PRT 

<213> Homo sapiens 
<400> 152 

Gin Gly Arg Ser Arg Met His Val Ser Leu Pro Thr His Leu Cys His 
15 10 15 

Val Gly Ser Phe Arg Ser Ala Met Val Arg Lys Glu Gin Lys Leu Leu 
20 25 30 

Val Val Phe Val Leu Phe Tip Arg He Cys Leu Pro Val Asn Thr Ser 
35 40 45 

Leu Pro Val Pro Gin Met Leu Pro Ala Pro 
50 55 



<210> 153 
<211> 36 
<212> PRT 

<213> Homo sapiens 



WO 00/71710 



110 



PCT/FROO/01426 



<400> 153 

Arg lie Thr -Thr Gly Gly Gly Arg 
1 5 

Ser Ala Pro Trp Gly Ala Arg Gin 
20 

Ala Gly Arg Leu 
35 



Trp Val Pro Ala Gly Gly Gly Val 
10 15 

Ser Gly Gly Gly Ser Ala Ala Gly 
25 30 



<210> 154 

<211> 651 

<212> PRT 

<213> Homo sapiens 



<400> 154 

Pro Xaa Pro Gly Ser Phe Gly Xaa Ala Met Gly Cys Cys Ser Ser Ala 
15 10 15 



Ser Ser Ala Ala 
20 

Arg Ser Cys Thr 
35 

He Gly Met Gly 
50 

Ala Arg Leu Val 
65 

Lys Asn Thr Lys 



Gin Arg Lys Tyr 
100 

Asn Arg Lys He 
115 

Gin Glu Leu Lys 
130 

Gly Ser Ala Leu 
145 



Gin Ser Ser Lys 



Asp He Pro Trp 
40 

Phe He Cys Gly 
55 

Ser Gly Tyr Asp 
70 

Leu Glu Ala He 
85 

Val Phe Phe Leu 



Lys Ser Val Ala 
120 

Thr Leu Ser Asp 
135 

Cys Ser Tyr Xaa 
150 



Arg Glu Trp Lys 
25 

Leu Leu Leu Phe 



Phe Ser He Ala 
60 

Ser Tyr Gly Asn 
75 

Pro Asn Ser Gly 
90 

Asp Pro Cys Asn 
105 

Leu Cys Val Ala 



Val Gin Lys Phe 
140 

Leu Lys Pro Ser 
155 



Pro Leu Glu Asp 
30 

He Leu Phe Cys 
45 

Thr Gly Ala Ala 



He Cys Gly Gin 
80 

Met Asp His Thr 
95 

Leu Asp Leu He 
110 

Ala Cys Pro Arg 
125 

Ala Glu He Asn 



Glu Tyr Thr Thr 
160 
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Ser Pro Lys Ser Ser Val Leu Cys Pro Lys Leu Pro Val Pro Ala Ser 
165 170 175 

Ala Pro lie Pro Phe Phe His Arg Cys Ala Pro Val Asn He Ser Cys 
180 185 190 

Tyr Ala Lys Phe Ala Glu Ala Leu He Thr Phe Val Ser Asp Asn Ser 
195 200 205 

Val Leu His Arg Leu He Ser Gly Val Met Thr Ser Lys Glu He He 
210 215 220 

Leu Gly Leu Cys Leu Leu Ser Leu Val Leu Ser Met He Leu Met Val 
225 230 235 240 

He He Arg Tyr He Ser Arg Val Leu Val Trp He Leu Thr He Leu 
245 250 255 

Val He Leu Gly Ser Leu Gly Gly Thr Gly Val Leu Trp Trp Leu Tyr 
260 265 270 

Ala Lys Gin Arg Arg Ser Pro Lys Glu Thr Val Thr Pro Glu Gin Leu 
275 280 285 

Gin He Ala Glu Asp Asn Leu Arg Ala Leu Leu He Tyr Ala He Ser 
290 295 300 

Ala Thr Val Phe Thr Val He Leu Phe Leu He Met Leu Val Met Arg 
305 310 315 320 

Lys Arg Val Ala Leu Thr He Ala Leu Phe His Val Ala Gly Lys Val 
325 330 335 

Phe He His Leu Pro Leu Leu Val Phe Gin Pro Phe Trp Thr Phe Phe 
340 345 350 

Ala Leu Val Leu Phe Trp Val Tyr Trp He Met Thr Leu Leu Phe Leu 
355 360 365 

Gly Thr Thr Gly Ser Pro Val Gin Asn Glu Gin Gly Phe Val Glu Phe 
370 375 380 



Lys He Ser Gly Pro Leu Gin Tyr Met Trp Trp Tyr His Val Val Gly 
385 390 395 400 



Leu He Trp He Ser Glu Phe He Leu Ala Cys Gin Gin Met Thr Val 
405 410 415 
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Ala Gly Ala Val Val Thr Tyr Tyr Phe Thr Arg Asp Lys Arg Asn Leu 
420 425 430 

Pro Phe Thr Pro lie Leu Ala Ser Val Asn Arg Leu He Arg Tyr His 
435 440 445 

Leu Gly Thr Val Ala Lys Gly Ser Phe He lie Thr Leu Val Lys He 
450 455 460 

Pro Arg Met He Leu Met Tyr He His Ser Gin Leu Lys Gly Lys Glu 
465 470 475 480 

Asn Ala Cys Ala Arg Cys Val Leu Lys Ser Cys He Cys Cys Leu Trp 
485 490 495 

Cys Leu Glu Lys Cys Leu Asn Tyr Leu Asn Gin Asn Ala Tyr Thr Ala 
500 505 510 

Thr Ala He Asn Ser Thr Asn Phe Cys Thr Ser Ala Lys Asp Ala Phe 
515 520 525 

Val He Leu Val Glu Asn Ala Leu Arg Val Ala Thr He Asn. Thr Val 
530 535 540 

Gly Asp Phe Met Leu Phe Leu Gly Lys Val Leu He Val Cys Ser Thr 
545 550 555 560 

Gly Leu Ala Gly He Met Leu Leu Asn Tyr Gin Gin Asp Tyr Thr Val 
565 570 575 

Trp Val Leu Pro Leu He He Val Cys Leu Phe Ala Phe Leu Val Ala 
580 585 590 

His Cys Phe Leu Ser He Tyr Glu Met Val Val Asp Val Leu Phe Leu 
595 600 605 

Cys Phe Ala He Asp Thr Lys Tyr Asn Asp Gly Ser Pro Gly Arg Glu 
610 615 620 

Phe Tyr Met Asp Lys Val Leu Met Glu Phe Val Glu Asn Ser Arg Lys 
625 630 635 640 

Ala Met Lys Glu Ala Gly Lys Gly Gly Arg Arg 
645 650 



<210> 155 



WO 00/71710 



113 



PCT/FROO/01426 



<211> 1066 
<212> PRT 

<213> Homo sapiens 



<400> 155 

Asn Gly Lys Phe Ser Tyr Thr Asp 
1 5 

Tyr Ser Cys Asn Arg Gly Phe Arg 
20 

Cys Leu Glu Thr Gly Asp Trp Asp 
35 40 

lie His Cys Asp Ser Pro Gin Pro 
50 55 

Ala Asp Tyr Ser Tyr Gly Ala lie 
65 70 



Leu His Tyr Gly Gin Thr Val Thr 
10 15 

Xaa Glu Gly Pro Ser Ala Leu Thr 
25 30 

Val Asp Ala Pro Ser Cys Asn Ala 
45 

He Glu Asn Gly Phe Val Glu Gly 
60 

He He Tyr Ser Cys Phe Pro Gly 

75 80 



Phe Gin Val Ala Gly His Ala Met Gin Thr Cys Glu Glu Ser Gly Trp 
85 90 . 95 

Ser Ser Ser He Pro Thr Cys Met Pro He Asp Cys Gly Leu Pro Pro 
100 105 110 

His He Asp Phe Gly Asp Cys Thr Lys Leu Lys Asp Asp Gin Gly Tyr 
115 120 125 



Phe Glu Gin Glu Asp Asp Met Met 
130 135 

Pro Pro Tyr His Leu Gly Ala Val 
145 150 

Glu Ser Pro Ala Thr His Ser Ser 
165 



Glu Val Pro Tyr Val Thr Pro His 
140 

Ala Lys Thr Trp Glu Asn Thr Lys 
155 160 

Asn Phe Leu Tyr Gly Thr Met Val 
170 175 



Ser Tyr Thr Cys Xaa Pro Gly Tyr Glu Leu Leu Gly Asn Pro Val Leu 
180 185 190 

He Xaa Gin Glu Asp Gly Thr Trp Asn Gly Ser Ala* Pro Ser Cys He 
195 200 205 

Ser He Glu Cys Asp Leu Pro Thr Ala Pro Glu Asn Gly Phe Leu Arg 
210 215 220 



Phe Thr Glu Thr Ser Met Gly Ser Ala Val Gin Tyr Ser Cys Lys Pro 
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225 



230 



235 



240 



Gly His' lie Leu Ala Gly Ser Asp Leu Arg Leu Cys Leu Glu Asn Arg 
245 250 255 

Lys Trp Ser Gly Ala Ser Pro Arg Cys Glu Ala He Ser Cys Lys Lys 
260 265 270 

Pro Asn Pro Val Met Asn Gly Ser He Lys Gly Ser Asn Tyr Thr Tyr 
275 280 285 

Leu Ser Thr Leu Tyr Tyr Glu Cys Asp Pro Gly Tyr Val Leu Asn Gly 
290 295 300 

Thr Glu Arg Arg Thr Cys Gin Asp Asp Lys Asn Trp Asp Glu Asp Glu 
305 310 315 320 

Pro He Cys He Pro Val Asp Cys Ser Ser Pro Pro Val Ser Ala Asn 
325 330 335 

Gly Gin Val Arg Gly Asp Glu Tyr Thr Phe Gin Lys Glu He Glu Tyr 
340 345 350. 

Thr Cys Asn Glu Gly Phe Leu Leu Glu Gly Ala Arg Ser Arg Val Cys 
355 360 365 

Leu Ala Asn Gly Ser Trp Ser Gly Ala Thr Pro Asp Cys Val Pro Val 
370 375 380 

Arg Cys Ala Thr Pro Pro Gin Leu Ala Asn Gly Val Thr Glu Gly Leu 
385 390 395 400 

Asp Tyr Gly Phe Met Lys Glu Val Thr Phe His Cys His Glu Gly Tyr 
405 410 415 

He Leu His Gly Ala Pro Lys Leu Thr Cys Gin Ser Asp Gly Asn Trp 
420 425 430 

Asp Ala Glu He Pro Leu Cys Lys Pro Val Asn Cys Gly Pro Pro Glu 
435 440 445 

Asp Leu Ala His Gly Phe Pro Asn Gly Phe Ser Phe He His Gly Gly 
450 455 460 

His He Gin Tyr Gin Cys Phe Pro Gly Tyr Lys Leu His Gly Asn Ser 
465 470 475 480 



Ser Arg Arg Cys Leu Ser Asn Gly Ser Trp Ser Gly Ser Ser Pro Ser 
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485 



490 



495 



Cys Leu Pro Cys Arg Cys Ser Thr Pro Val lie Glu Tyr Gly Thr Val 
500 505 510 

Asn Gly Thr Asp Phe Asp Cys Gly Lys Ala Ala Arg He Gin Cys Phe 
515 520 525 

Lys Gly Phe Lys Leu Leu Gly Leu Ser Glu He Thr Cys Glu Ala Asp 
530 535 540 

Gly Gin Trp Ser Ser Gly Phe Pro His Cys Glu His Thr Ser Cys Gly 
545 550 555 560 

Ser Leu Pro Met He Pro Asn Ala Phe He Ser Glu Thr Ser Ser Trp 
565 570 575 

Lys Glu Asn Val He Thr Tyr Ser Cys Arg Ser Gly Tyr Val He Gin 
580 585 590 

Gly Ser Ser Asp Leu He Cys Thr Glu Lys Gly Val Trp Ser Gin Pro 
595 600 605 

Tyr Pro Val Cys Glu Pro Leu Ser Cys Gly Ser Pro Pro Ser Val Ala 
610 615 620 

Asn Ala Val Ala Thr Gly Glu Ala His Thr Tyr Glu Ser Glu Val Lys 
625 630 635 640 

Leu Arg Cys Leu Glu Gly Tyr Thr Met Asp Thr Asp Thr Asp Thr Phe 
645 650 655 

Thr Cys Gin Lys Asp Gly Arg Trp Phe Pro Glu Arg He Ser Cys Ser 
660 665 670 

Pro Lys Lys Cys Pro Leu Pro Glu Asn He Thr His lie Leu Val His 
675 680 665 

Gly Asp Asp Phe Ser Val Asn Arg Gin Val Ser Val Ser Cys Ala Glu 
690 695 700 

Gly Tyr Thr Phe Glu Gly Val Asn He Ser Val Cys' Gin Leu Asp Gly 
705 710 715 720 



Thr Trp Glu Pro Pro Phe Ser Asp Glu Ser Cys Ser Pro Val Ser Cys 
725 730 735 



Gly Lys Pro Glu Ser Pro Glu His Gly Phe Val Val Gly Ser Lys Tyr 
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740 745 ■ 750 

Thr Phe Glu Ser Thr lie lie Tyr Gin Cys Glu Pro Gly Tyr Glu Leu 
755 760 765 

Glu Gly Asn Arg Glu Arg Val Cys Gin Glu Asn Arg Gin Trp Ser Gly 
770 775 780 

Gly Val Ala lie Cys Lys Glu Thr Arg Cys Glu Thr Pro Leu Glu Phe 
785 790 795 800 

Leu Asn Gly Lys Ala Asp lie Glu Asn Arg Thr Thr Gly Pro Asn Val 
805 810 815 

Val Tyr Ser Cys Asn Arg Gly Tyr Ser Leu Glu Gly Pro Ser Glu Ala 
820 825 830 

His Cys Thr Glu Asn Gly Thr Trp Ser His Pro Val Pro Leu Cys Lye 
835 840 845 

Pro Asn Pro Cys Pro Val Pro Phe Val lie Pro Glu Asn Ala Leu Leu 
850 855 860 

Ser Glu Lys Glu Phe Tyr Val Asp Gin Asn Val Ser lie Lys Cys Arg 
865 870 875 880 

Glu Gly Phe Leu Leu Gin Gly His Gly lie He Thr Cys Asn Pro Asp 
885 890 895 

Glu Thr Trp Thr Gin Thr Ser Ala Lys Cys Glu Lys He Ser Cys Gly 
900 905 910 

Pro Pro Ala His Val Glu Asn Ala He Ala Arg Gly Val His Tyr Gin 
915 920 925 

Tyr Gly Asp Met He Thr Tyr Ser Cys Tyr Ser Gly Tyr Met Leu Glu 
930 935 940 

Gly Phe Leu Arg Ser Val Cys Leu Glu Asn Gly Thr Trp Thr Ser Pro 
945 950 955 960 

Pro He Cys Arg Ala val Cys Arg Phe Pro Cys Gin Asn Gly Gly He 
965 970 975 

Cys Gin Arg Pro Asn Ala Cys Ser Cys Pro Glu Gly Trp Met Gly Arg 
980 985 990 

Leu Cys Glu Glu Pro He Cys He Leu Pro Cys Leu Asn Gly Gly Arg 



WO 00/71710 



117 



PCI/FR00/01426 



995 1000 1005 

Cys Val Ala Pro Tyr Gin Cys Asp Cys Pro Pro Gly Tip Thr Gly Ser 
1010 1015 1020 

Arg Cys His Thr Ala Val Cys Gin Ser Pro Cys Leu Asn Gly Gly Lys 
1025 1030 1035 1040 

Cys Val Arg Pro Asn Arg Cys His Cys Leu Ser Ser Trp Thr Gly His 
1045 1050 1055 

Asn Cys Ser Arg Lys Arg Arg Thr Gly Phe 
1060 1065 



<210> 156 

<211> 43 

<212> PRT 

<213> Homo sapiens 

<400> 156 

Ser Gin Lys Asp Leu lie Gly Glu 
1 5 

Val Tyr Ser Thr Pro Pro Pro Lys 
20 

Arg Asn Arg Ala Asn Met Cys Gly 
35 40 



He Gin Ser Val Thr Cys Glu Glu 
10 15 

Lys He Phe Gly He Tyr Thr Ser 
25 30 

Asn Ala Tyr 



<210> 157 
<211> 61 
<212> PRT 

<213> Homo sapiens 
<400> 157 

Val Asp Ser Pro Pro Thr Ser Pro Phe Val Ser Arg Pro He Ser Arg 
15 10 15 

Gin Glu Ser Gin Lys Asp Leu He Gly Glu He Gin Ser Val Thr Cys 
20 25 30 

Glu Glu Val Tyr Ser Thr Pro Pro Pro Lys Lys He Phe Gly He Tyr 
35 40 45 
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Thr Ser Arg Asn Arg Ala Asn Met Cys Gly Asn Ala Tyr 
50 55 60 



<210> 158 
<211> 263 
<212> PRT 

<213> Homo sapiens 
<400> 156 

Leu Arg Lys Asp Thr Ala Gly Cys Phe Ser Gin Arg Arg Ser Arg Ala 
1 5 10 15 

Met Leu Val Leu Arg Ser Ala Leu Thr Arg Ala Leu Ala Ser Arg Thr 
20 25 30 

Leu Ala Pro Gin Met Cys Ser Ser Phe Ala Thr Gly Pro Arg Gin Tyr 
35 40 45 

Asp Gly He Phe Tyr Glu Phe Arg Ser Tyr Tyr Leu Lys Pro Ser Lys 
50 55 60 

Met Asn Glu Phe Leu Glu Asn Phe Glu Lys Asn Ala His Leu Arg Thr 
65 70 75 80 

Ala His Ser Glu Leu Val Gly Tyr Trp Ser Val Glu Phe Gly. Gly Arg 
85 90 95 

Met Asn Thr Val Phe His He Trp Lys Tyr Asp Asn Phe Ala His Arg 
100 105 110 

Thr Glu Val Arg Lys Ala Leu Ala Lys Asp Lys Glu Trp Gin Glu Gin 
115 120 125 

Phe Leu He Pro Asn Leu Ala Leu He Asp Lys Gin Glu Ser Glu He 
130 135 140 

Thr Tyr Leu Val Pro Trp Cys Lys Leu Glu Lys Pro Pro Lys Glu Gly 
145 150 155 160 

Val Tyr Glu Leu Ala Thr Phe Gin Met Lys Pro Gly Gly Pro Ala Leu 
165 170 175 

Trp Gly Asp Ala Phe Lys Arg Ala Val His Ala His Val Asn Leu Gly 
180 185 190 



Tyr Thr Lys Leu Val Gly Val Phe His Thr Glu Tyr Gly Glu Leu 



Asn 
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195 



200 



205 



Arg Val 
210 



His 



Val Leu Trp Trp Asn Glu Ser Ala Asp Ser Arg Ala Ala 
215 220 



Gly Arg His hys Ser His Glu Asp Pro Arg Val Val Ala Ala Val Arg 
225 230 235 240 

Glu Ser Val Asn Tyr Leu Val Ser Gin Gin Asn Met Leu Leu lie Pro 
245 250 255 

Ala Ser Phe Ser Pro Leu Lys 



<210> 159 
<211> 203 
<212> PRT 

<213> Homo sapiens 
<400> 159 

Tyr Lys Pro Val Lys Trp Val He Ser Leu Thr Pro Leu Ser Gin Pro 
15 10 15 

Gly Pro Ser Ser Asn He He Gly Gin Ser Val Glu Glu Ala He Arg 
20 25 30 

Gly Val Phe Asp Ala Ser Leu Lys Met Ala Gly Phe Tyr Gly Leu Tyr 
35 40 45 

Thr Trp Leu Thr His Thr Met Phe Gly lie Asn He Val Phe He Pro 
50 55 60 

Ser Ala Leu Ala Ala He Leu Gly Ala Val Pro Phe Leu Gly Thr Tyr 
65 70 75 80 

Trp Ala Ala Val Pro Ala Val Leu Asp Leu Trp Leu Thr Gin Gly Leu 



Gly Cys Lys Ala lie Leu Leu Leu lie Phe His Leu Leu Pro Thr Tyr 
100 105 110 

Phe Val Asp Thr Ala lie Tyr Ser Asp lie Ser Gly Gly Gly His Pro 
115 120 125 

Tyr Leu Thr Gly Leu Ala Val Ala Gly Gly Ala Tyr Tyr Leu Gly Leu 
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Glu Gly Ala lie He Gly Pro He 
145 150 

Ser Asn He Tyr Ser Ala Met Leu 

" 165 

Thr Pro Asn Gin Thr Pro Trp Pro 
180 

Asp He Ser Glu Asp Leu Lys Ser 
195 200 



Leu Leu Cys He Leu Val Val Ala 
155 160 

Val Ser Pro Thr Asn Ser Val Pro 
170 175 

Ala Gin Pro Gin Arg Thr Phe Arg 
185 190 

Ser Val Gly 



<210> 160 
<211> 85 
<212> PRT 

<213> Homo sapiens 
<400> 160 

Val Leu Thr Pro Gly Pro Glu Val Gly Cys Asn Cys Leu Trp. Lys He 
1 5 10 15 

Leu Pro Leu Ser His Pro His Pro Leu Val Pro Ala Ly3 Asn Ala Gly 
20 25 30 

Asp Ser Ala Thr Met Leu Cys Val Pro Leu Asn Leu Cys Ala Ala Arg 
35 40 45 

Lys Ala Asp Val Gin Val Tyr Leu Asn Pro His Tyr Ser His Ala Pro 
50 55 60 

Asn Val His Gly His Phe Cys Asn Ser Ala His lie Leu Thr Val Phe 
$5 70 75 80 

Glu Lys Leu Ala Val . 

85 



